Основы математической статистики

Содержание

Слайд 2

Законы теории вероятностей – это математическое выражение реальных закономерностей, которым подчиняются

Законы теории вероятностей – это математическое выражение реальных закономерностей, которым подчиняются

массовые случайные явления. При этом каждое исследование случайных явлений, выполняемое методами теории вероятностей, прямо или косвенно опирается на экспериментальные данные, на результаты испытаний и наблюдений.
Слайд 3

Разработка методов получения, описания и анализа экспериментальных данных, определенных в результате

Разработка методов получения, описания и анализа экспериментальных данных, определенных в результате

исследования массовых случайных явлений, составляет предмет специальной науки – математической статистики.
Слайд 4

Статистическими данными называются сведения о числе объектов в какой-либо более или

Статистическими данными называются сведения о числе объектов в какой-либо более или

менее обширной совокупности, обладающих теми или иными признаками.
Предположим, что необходимо изучить множество объектов по какому-либо признаку. Это возможно сделать, либо произведя сплошное наблюдение (исследование, измерение), либо не сплошное (выборочное).

1. Основные понятия математической статистики

Слайд 5

Выборочное исследование всегда предпочтительнее: а) по экономическим причинам (меньшая трудоемкость), б)

Выборочное исследование всегда предпочтительнее:
а) по экономическим причинам (меньшая трудоемкость),
б)

часто сплошное обследование нереально (необходимо уничтожить все исследуемые объекты, невозможно обследовать все население Земли и т.п.).
Слайд 6

Статистическая совокупность, состоящая из всех объектов, которые (по крайней мере теоретически)

Статистическая совокупность, состоящая из всех объектов, которые (по крайней мере теоретически)

подлежат исследованию, называется генеральной совокупностью, а множество объектов, отобранных из нее по определенным правилам – выборочной совокупностью (выборкой).
Слайд 7

Главная цель выборочного метода – по вычисленным числовым характеристикам выборки как

Главная цель выборочного метода – по вычисленным числовым характеристикам выборки как

можно точнее определить соответствующие характеристики генеральной совокупности.
Слайд 8

Изучаемое свойство объектов выборки должно соответствовать свойству объектов генеральной совокупности, то

Изучаемое свойство объектов выборки должно соответствовать свойству объектов генеральной совокупности, то

есть выборка должна быть представительной (репрезентативной).
Случайность отбора – обязательное условие репрезентативности выборки.
Свойства выборочной совокупности тем лучше отражают свойства генеральной совокупности, чем больше объектов содержит эта выборочная совокупность (т.е. чем больше ее объем).
Слайд 9

На практике всегда необходимо искать компромисс, чтобы исследуемые выборки были, с

На практике всегда необходимо искать компромисс, чтобы исследуемые выборки были, с

одной стороны, не слишком велики, а с другой – репрезентативны.
Слайд 10

а) Статистический дискретный ряд распределения Пусть необходимо изучить распределение значений признака

а) Статистический дискретный ряд распределения
Пусть необходимо изучить распределение значений признака Х

у объектов некоторой генеральной совокупности.
С этой целью из данной генеральной совокупности извлекают некоторую выборочную совокупность объемом n.

2. Статистическое распределение выборки

Слайд 11

Пусть в полученной выборке наименьшее значение x1 признака встречается m1 раз,

Пусть в полученной выборке наименьшее значение x1 признака встречается m1 раз,

следующее по величине значение x1 – m2 раз, и так далее, до хk – mk раз.
Наблюдаемые значения признака (x1, x2, x3 и т.д.) принято называть вариантами, а числа m1, m2, m3, …mk – их частотами.
Естественно, что сумма всех частот равна объему выборки (n ).
m1 + m2 + m3 +…+ mk = n
Слайд 12

Если результаты наблюдений представить в виде таблицы, то получим: Здесь p – относительная частота.

Если результаты наблюдений представить в виде таблицы, то получим:

Здесь p –

относительная частота.
Слайд 13

Такую таблицу называют статистическим дискретным рядом распределения. Cтатистический дискретный ряд распределения

Такую таблицу называют статистическим дискретным рядом распределения.
Cтатистический дискретный ряд распределения –

это совокупность вариант и соответствующих им частот (или относительных частот).
В медицинской литературе статистическое распределение, состоящее из вариант и соответствующих им частот, получило название вариационного ряда.
Слайд 14

Для графического изображения подобного ряда на координатной плоскости откладывают точки (xi;

Для графического изображения подобного ряда на координатной плоскости откладывают точки (xi;

mi) и соединяют их отрезками прямых. Такую ломаную линию, являющуюся графическим представлением дискретного статистического ряда распределения, называют полигоном частот.
Слайд 15

Пример. Анализируемый показатель Х – срок лечения больного при некотором заболевании.

Пример. Анализируемый показатель Х – срок лечения больного при некотором заболевании.

Вариационный ряд – распределение больных по срокам лечения (объем выборки n = 26 больных) – имеет вид:
Слайд 16

Слайд 17

Очевидно, что представление результатов наблюдений в виде статистического дискретного ряда распределения

Очевидно, что представление результатов наблюдений в виде статистического дискретного ряда распределения

на практике удобно лишь в случае ограниченного (не более 10-20) количества различающихся между собой вариант в выборочной совокупности.
Если же количество таких вариант существенно больше, то результаты представляют в виде статистического интервального ряда распределения.

б) Статистический интервальный ряд распределения

Слайд 18

Для построения такого ряда всю область наблюдаемых значений изучаемого признака Х

Для построения такого ряда всю область наблюдаемых значений изучаемого признака Х

разбивают на некоторое небольшое количество равных по величине интервалов и фиксируют количество значений признака, принадлежащих каждому интервалу (суммe частот вариант, попавших в этот интервал).
Слайд 19

Пусть, например все наблюдавшиеся значения признака Х принадлежат интервалу (a,b). Разделим

Пусть, например все наблюдавшиеся значения признака Х принадлежат интервалу (a,b). Разделим

этот интервал на k равных частей (частичных интервалов) длиной Δх = (b-a)|k и обозначим точки деления как x0=a, x1, x2, …, xk-1, xk=b.
Если частоты интервалов равны, соответственно, m1, m2, …, mk, то можно составить таблицу, в первой строке которой перечислить все частичные интервалы, а во второй соответствующие им частоты (или относительные частоты):
Слайд 20

Слайд 21

Графическим изображением статистического интервального ряда распределения является фигура, называемая полигоном частот

Графическим изображением статистического интервального ряда распределения является фигура, называемая полигоном частот

(или относительных частот). Это совокупность смежных прямоугольников, основания которых равны Δх, а высоты – отношению mi / Δх (или pi / Δх).
Слайд 22

Слайд 23

Площадь каждого прямоугольника равна: или Площадь гистограммы частот равна n, а

Площадь каждого прямоугольника равна:

или

Площадь гистограммы частот равна n, а площадь гистограммы

относительных частот равна 1.
Слайд 24

Мода (Mo) равна варианте, которой соответствует наибольшая частота. Медиана (Ме) равна

Мода (Mo) равна варианте, которой соответствует наибольшая частота.
Медиана (Ме) равна варианте,

которая расположена в середине статистического распределения. Она делит вариационный ряд на две равные части. При четном числе вариант за медиану принимают среднее значение из двух центральных вариант.

3. Выборочные характеристики распределения

Слайд 25

Выборочная средняя – это среднее арифметическое вариант статистического ряда. где mi

Выборочная средняя – это среднее арифметическое вариант статистического ряда.

где mi –

частота встречаемости значения xi в выборке,
k – количество различающихся между собой значений признака (количество вариант),
n – объем выборки.
Слайд 26

Для характеристики рассеяния вариант вокруг среднего значения вводят характеристику, называемую выборочной

Для характеристики рассеяния вариант вокруг среднего значения вводят характеристику, называемую выборочной

дисперсией – среднее арифметическое квадратов отклонения вариант от их среднего значения.
Слайд 27

Корень квадратный из выборочной дисперсии называют выборочным средним квадратическим отклонением.

Корень квадратный из выборочной дисперсии называют выборочным средним квадратическим отклонением.

Слайд 28

Предположим, что генеральная совокупность является нормальным распределением. Нормальное распределение полностью определено

Предположим, что генеральная совокупность является нормальным распределением. Нормальное распределение полностью определено

математическим ожиданием и средним квадратическим отклонением. Поэтому, если по выборке можно оценить, то есть приближенно найти, эти параметры, то будет решена одна из задач математической статистики – определение параметров большого массива по исследованию его части.

4. Оценка параметров генеральной совокупности по ее выборке. Точечные оценки.

Слайд 29

Как и для выборки, для генеральной совокупности можно определить генеральную среднюю

Как и для выборки, для генеральной совокупности можно определить генеральную среднюю

- среднее арифметическое значение всех величин, составляющих генеральную совокупность (учитывая большой объем этой совокупности, можно считать, что генеральная средняя равна математическому ожиданию).
Слайд 30

Рассеяние значений изучаемого признака генеральной совокупности оценивают генеральной дисперсией или генеральным средним квадратическим отклонением.

Рассеяние значений изучаемого признака генеральной совокупности оценивают генеральной дисперсией или генеральным

средним квадратическим отклонением.
Слайд 31

а) Точечные оценки Оценка характеристики распределения называется точечной, если она определяется

а) Точечные оценки
Оценка характеристики распределения называется точечной, если она определяется одним

числом, которому приближенно равна оцениваемая характеристика.
Слайд 32

Наилучшей оценкой генеральной средней является средняя выборочная:

Наилучшей оценкой генеральной средней является средняя выборочная:

Слайд 33

Наилучшей точечной оценкой генеральной дисперсии является так называемая исправленная выборочная дисперсия , определяемая по формуле:

Наилучшей точечной оценкой генеральной дисперсии является так называемая исправленная выборочная дисперсия

, определяемая по формуле:
Слайд 34

Наилучшей точечной оценкой генерального среднего квадратического отклонения является исправленное выборочное среднее квадратическое отклонение.

Наилучшей точечной оценкой генерального среднего квадратического отклонения является исправленное выборочное среднее

квадратическое отклонение.
Слайд 35

Точечные оценки параметров генеральной совокупности справедливы лишь при достаточно большом объеме

Точечные оценки параметров генеральной совокупности справедливы лишь при достаточно большом объеме

выборки. При небольшом объеме выборки пользуются интервальными оценками.
В этом случае указывается интервал (доверительный интервал), в котором с определенной (как правило, заранее заданной) вероятностью р (доверительной вероятностью) находится генеральная средняя.

б) Интервальная оценка генеральной средней

Слайд 36

Иначе говоря, р определяет вероятность того, что осуществляются следующие неравенства: где

Иначе говоря, р определяет вероятность того, что осуществляются следующие неравенства:

где положительное

число ε характеризует точность оценки.
Слайд 37

Чем шире доверительный интервал, тем выше доверительная вероятность, и наоборот. При

Чем шире доверительный интервал, тем выше доверительная вероятность, и наоборот. При

решении статистических задач в фармации, медицине и биологии доверительную вероятность, как правило, принимают равной 0,95 (реже – 0,99).
Слайд 38

Кроме доверительной вероятности, используют противоположное понятие – уровень значимости (вероятность непопадания генеральной средней в доверительный интервал).

Кроме доверительной вероятности, используют противоположное понятие – уровень значимости (вероятность непопадания

генеральной средней в доверительный интервал).
Слайд 39

При оценке генеральной средней по результатам выборочных наблюдений в предположении нормального

При оценке генеральной средней по результатам выборочных наблюдений в предположении нормального

распределения признака в генеральной совокупности доверительный интервал для заданной доверительной вероятности находят следующим методом:
Слайд 40

Определяют полуширину доверительного интервала для интервальной оценки генеральной средней при заданной доверительной вероятности р по формуле:

Определяют полуширину доверительного интервала для интервальной оценки генеральной средней при заданной

доверительной вероятности р по формуле:
Слайд 41

Интервальная оценка генеральной средней может быть использована для оценки истинного значения

Интервальная оценка генеральной средней может быть использована для оценки истинного значения

измеряемой величины.
Пусть несколько раз измеряют одну и ту же физическую величину. При этом по разным случайным причинам получают разные значения: x1, x2, x3,…xi. Будем считать, что нет преобладающего влияния какого-либо фактора на эти измерения.

в) Интервальная оценка истинного значения измеряемой величины