Элементы математической статистики

Содержание

Слайд 2

Финансовый университет при Правительстве Российской Федерации Шевелёв Александр Юрьевич доцент, кандидат физико- математических наук.

Финансовый университет
при Правительстве Российской Федерации

Шевелёв
Александр Юрьевич
доцент, кандидат физико-
математических наук.

Слайд 3

Финансовый университет при Правительстве Российской Федерации Математика

Финансовый университет
при Правительстве Российской Федерации

Математика

Слайд 4

Финансовый университет при Правительстве Российской Федерации Тема №13. Элементы математической статистики

Финансовый университет
при Правительстве Российской Федерации

Тема №13.
Элементы математической статистики

Слайд 5

Математическая статистика Предметом математической статистики является изучение совокупности однородных объектов относительно

Математическая статистика

Предметом математической статистики является изучение совокупности однородных объектов относительно

некоторого количественного или качественного признака, характеризующего эти объекты по результатам наблюдений.
Слайд 6

Математическая статистика Наблюдения могут заключаться либо в измерении какого-нибудь параметра исследуемого

Математическая статистика

Наблюдения могут заключаться либо в измерении какого-нибудь параметра исследуемого

объекта, либо в регистрации у него того или иного признака. В общем случае измеряемых параметров или регистрируемых признаков может быть несколько. При этом наблюдения могут производиться как над самими объектами, так и над их моделями.
Слайд 7

Математическая статистика К числу наиболее часто встречающихся задач математической статистики относятся:

Математическая статистика

К числу наиболее часто встречающихся задач математической статистики относятся:

1. Определение по результатам независимых наблюдений частоты наступления случайного события и оценка на этой основе его вероятности;
2. Оценка законов распределения случайных величин по результатам наблюдений;
3. Определение неизвестных значений числовых характеристик случайных величин, оценка их точности и надёжности;
Слайд 8

Математическая статистика 4. Проверка статистических гипотез о виде закона распределения или

Математическая статистика

4. Проверка статистических гипотез о виде закона распределения или

его числовых характеристиках;
5. Оценка степени взаимосвязи между несколькими характеристиками исследуемых объектов (корреляция).
Слайд 9

Математическая статистика В практике статистических наблюдений различают два вида: сплошное, когда

Математическая статистика

В практике статистических наблюдений различают два вида: сплошное, когда

изучаются все объекты и выборочное, когда изучается часть объектов (выборочный метод).
Слайд 10

Генеральной совокупностью называют множество всех объектов над которыми необходимо произвести наблюдение.

Генеральной совокупностью называют множество всех объектов над которыми необходимо произвести

наблюдение.
Выборочной совокупностью (выборкой) называется та часть генеральной совокупности, которая отобрана для непосредственного изучения.
Слайд 11

Число объектов в совокупности называется её объёмом. N – объём генеральной

Число объектов в совокупности называется её объёмом. N – объём

генеральной совокупности, n – объём выборки.
Суть выборочного метода в том, чтобы по выборке можно было бы делать выводы о тех же свойствах генеральной совокупности.
Слайд 12

Математическая статистика Чтобы по выборке можно было уверенно судить об изучаемой

Математическая статистика

Чтобы по выборке можно было уверенно судить об изучаемой

случайной величине выборка должна быть собственно-случайной: любой объект генеральной совокупности может быть с одинаковой вероятностью отобран в выборку.
Слайд 13

Математическая статистика При этом возможны два способа образования выборки: повторная и

Математическая статистика

При этом возможны два способа образования выборки: повторная и

бесповторная.
Повторной называют выборку, при которой случайно отобранный и обследованный объект возвращается в генеральную совокупность и после этого снова может быть отобран в выборку.
Бесповторной называют выборку, при которой случайно отобранный и обследованный объект не возвращается в генеральную совокупность.
Слайд 14

Математическая статистика Накопленные в процессе исследования или эксперимента данные сначала подвергают

Математическая статистика

Накопленные в процессе исследования или эксперимента данные сначала подвергают

сортировке: ранжируют (упорядочение в порядке возрастания или убывания), затем группируют (в каждой группе возможные значения случайной величины одинаковы).
Слайд 15

Различные возможные значения случайной величины, соответствующие отдельной группе сгруппированного ряда наблюдаемых

Различные возможные значения случайной величины, соответствующие отдельной группе сгруппированного ряда

наблюдаемых данных называются вариантами.
Численность отдельной группы сгруппированного ряда наблюдаемых данных называется частотой варианта.
Отношение частоты данного варианта к объёму совокупности называется долей (относительной частотой) варианта.
Слайд 16

Математическая статистика Частоты и доли вариантов обобщённо называются весами. Сумма частот

Математическая статистика

Частоты и доли вариантов обобщённо называются весами.
Сумма частот

равна объёму совокупности, а сумма долей равна единице.
Слайд 17

Ранжированный в порядке возрастания (или убывания) ряд вариантов с соответствующими им

Ранжированный в порядке возрастания (или убывания) ряд вариантов с соответствующими

им весами называется дискретным вариационным рядом.
Обычно представляется в виде таблицы.
Слайд 18

Математическая статистика

Математическая статистика

Слайд 19

Математическая статистика Если изучаемая случайная величина является непрерывной, то строится интервальный

Математическая статистика

Если изучаемая случайная величина является непрерывной, то строится интервальный

вариационный ряд.
Длины интервалов называются интервальными разностями. В нашем случае для удобства расчётов будем брать ряды с одинаковыми интервальными разностями и затем заменять интервальный ряд дискретным, в котором в качестве варианта принимается середина интервала.
Слайд 20

Математическая статистика Для наглядности интервальный вариационный ряд можно изобразить в прямоугольной

Математическая статистика

Для наглядности интервальный вариационный ряд можно изобразить в прямоугольной

системе координат в виде гистограммы, которая представляет собой ступенчатую фигуру, состоящую из прямоугольников, основаниями которых на оси абсцисс являются интервалы значений признака, а высоты равны соответствующим им частотам или долям (на оси ординат).
Слайд 21

Математическая статистика Полигоном частот или относительных частот называется ломаная линия, соединяющая точки с координатами

Математическая статистика

Полигоном частот или относительных частот называется ломаная линия, соединяющая

точки с координатами
Слайд 22

Математическая статистика Основными числовыми характеристиками вариационных рядов являются средняя арифметическая и

Математическая статистика

Основными числовыми характеристиками вариационных рядов являются средняя арифметическая и

дисперсия вариационного ряда.
Средней арифметической вариационного ряда называется сумма произведений всех вариантов ряда на соответствующие им частоты, делённая на объём.
Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической.
Слайд 23

Математическая статистика По определению вести расчёты средней арифметической и дисперсии вариационного

Математическая статистика

По определению вести расчёты средней арифметической и дисперсии вариационного

ряда бывает сложно. Можно пользоваться следующими формулами:
Слайд 24

Математическая статистика

Математическая статистика

Слайд 25

Математическая статистика Известно, что для описания случайной величины достаточно знать её

Математическая статистика

Известно, что для описания случайной величины достаточно знать её

числовые характеристики (параметры). Например, математическое ожидание, дисперсию, с.к.о. Поэтому встаёт задача определения этих характеристик генеральной совокупности по тем же параметрам выборки.
Поскольку объём выборки мал, по сравнению с объёмом генеральной совокупности, то по выборке можно лишь оценить значения параметров генеральной совокупности.
Слайд 26

Выборочная числовая характеристика t, используемая в качестве приближённого значения неизвестной числовой

Выборочная числовая характеристика t, используемая в качестве приближённого значения неизвестной

числовой характеристики генеральной совокупности t, называется её точечной статистической оценкой.
Слайд 27

Математическая статистика Средние арифметические, дисперсии, а также с.к.о. распределения признака в

Математическая статистика

Средние арифметические, дисперсии, а также с.к.о. распределения признака в

генеральной и выборочной совокупностях называются генеральной средней, выборочной средней, генеральной дисперсией, выборочной дисперсией, генеральным с.к.о., выборочным с.к.о.
Слайд 28

Математическая статистика Выборочная средняя и выборочная доля являются точечными оценками генеральной

Математическая статистика

Выборочная средняя и выборочная доля являются точечными оценками генеральной

средней и генеральной доли. Но точечных оценок не достачно, следует выяснить степень рассеивания их относительно истинных параметров, т.е. дисперсию.
Слайд 29

Интервальной оценкой параметра t называется числовой интервал (a; b), который с

Интервальной оценкой параметра t называется числовой интервал (a; b), который

с заданной доверительной вероятностью «накрывает» неизвестное значение параметра t.
В этом случае интервал (a; b) называется доверительным интервалом, а вероятность - доверительной вероятностью.
Слайд 30

Доверительной вероятностью (надёжностью) называется вероятность того, что оценка x отклонится от

Доверительной вероятностью (надёжностью) называется вероятность того, что оценка x отклонится

от оцениваемого параметра t по абсолютной величине не более, чем на положительное число .
Слайд 31

Наибольшее отклонение выборочной числовой характеристики от соответствующей ей генеральной характеристики, которое

Наибольшее отклонение выборочной числовой характеристики от соответствующей ей генеральной характеристики,

которое возможно с заданной доверительной вероятностью называется предельной ошибкой выборки.
Слайд 32

Математическая статистика - Функция Лапласа, значения которой находятся в таблице. -

Математическая статистика

- Функция Лапласа, значения которой находятся в таблице.
-

выборочная средняя или доля,
- соответствующее ей с.к.о.
Слайд 33

Среднее квадратическое отклонение оценки х параметра t собственно случайной выборки называется

Среднее квадратическое отклонение оценки х параметра t собственно случайной выборки

называется средней квадратической ошибкой выборки.
Из последней формулы следует, что при заданной доверительной вероятности предельная ошибка выборки равна u-кратной величине средней квадратической ошибки, т.е. (u – аргумент функции Лапласа).
Слайд 34

Математическая статистика Формулы для средних квадратических ошибок имеют вид:

Математическая статистика

Формулы для средних квадратических ошибок имеют вид:

Слайд 35

Математическая статистика При интервальном оценивании решаются следующие задачи: Определение доверительного интервала

Математическая статистика

При интервальном оценивании решаются следующие задачи:
Определение доверительного интервала при

заданной доверительной вероятности и фиксированном объёме выборки;
Определение доверительной вероятности при заданном доверительном интервале и фиксированном объёме выборки;
Определение необходимого объёма выборки для достижения заданной точности и надёжности исследований.
Слайд 36

Математическая статистика Формулы расчёта объёма выборки имеют вид:

Математическая статистика

Формулы расчёта объёма выборки имеют вид:

Слайд 37

Математическая статистика При оценке генеральной доли в отсутствии предварительных сведений о

Математическая статистика

При оценке генеральной доли в отсутствии предварительных сведений о

значениях дисперсии и доли нет, то формула для объёма повторной выборки имеет следующий вид:
Слайд 38

Математическая статистика В науке и на практике часто ставится задача нахождения

Математическая статистика

В науке и на практике часто ставится задача нахождения

неизвестного закона распределения признака, являющегося случайной величиной. С этой целью производится эксперимент, в результате которого получают эмпирическое распределение случайной величины в виде вариационного ряда. Далее на основе анализа опытных данных по отношению к известным теоретическим распределениям делают предположение о том, какое распределение лучше других отражает опытное.
Слайд 39

Математическая статистика Т.е. выдвигается статистическая гипотеза (предположение о виде или параметрах

Математическая статистика

Т.е. выдвигается статистическая гипотеза (предположение о виде или параметрах

неизвестного закона распределения). Необходимо выяснить, справедлива ли она (степень её согласованности с имеющимся эмпирическим вариационным рядом).
Слайд 40

Математическая статистика Если на основании теоретических предпосылок и анализа опытных данных

Математическая статистика

Если на основании теоретических предпосылок и анализа опытных данных

приходим к выводу, что изучаемый признак распределён по нормальному закону, то нахождение нормального закона этого признака сводится к определению средней арифметической и дисперсии опытного распределения признака.
Слайд 41

Математическая статистика Затем вычисляют теоретические частоты, соответствующие опытным частотам по формуле:

Математическая статистика

Затем вычисляют теоретические частоты, соответствующие опытным частотам по формуле:
-

интервальная разность
- функция Гаусса (значения в таблице)
Слайд 42

Математическая статистика После этого выясняется степень согласованности данных эксперимента и статистической

Математическая статистика

После этого выясняется степень согласованности данных эксперимента и статистической

гипотезы. Для ответа на этот вопрос существуют критерии согласия, одним из которых является критерий Пирсона. В нём за меру расхождения эмпирического ряда с гипотезой принимают величину , которая вычисляется по формуле:
эмпирическая частота.
Слайд 43

Математическая статистика Полученное значение сравниваем с критическим (табличным). Для критического значения

Математическая статистика

Полученное значение сравниваем с критическим (табличным). Для критического значения

определяются число степеней свободы, которое на 3 единицы меньше, чем число интервалов и уровень значимости, который в наших гипотезах принимается равным 0,05.Если полученное значение больше критического, то гипотеза о нормальном распределении опытных данных отвергается, а если полученное меньше критического, то не отвергается.
Слайд 44

Задача Пример 1. Для исследования количества рабочих часов, выработанных одним работником

Задача

Пример 1. Для исследования количества рабочих часов, выработанных одним работником

на фирме в течение декады из тысячи сотрудников по схеме собственно-случайной выборки отобрано 200 человек. Получены следующие данные:
Слайд 45

Задача Найти доверительную вероятность того, что среднее количество рабочих часов всех

Задача

Найти доверительную вероятность того, что среднее количество рабочих часов всех

сотрудников отклонится от выборочной средней на более, чем на полчаса.
Найти границы, в которых с вероятностью 0,9876 заключено среднее количество рабочих часов для всех сотрудников.
Определить минимальный объём выборки, по которой с вероятностью 0,9876 можно было утверждать, что среднее количество часов, полученное по выборке, отличалось от генеральной средней не более, чем на 1,725 часа.
Слайд 46

Задача Рассмотреть повторную и бесповторную выборки. Проверить гипотезу о том, что

Задача

Рассмотреть повторную и бесповторную выборки.
Проверить гипотезу о том, что

количество рабочих часов, выработанных рабочим в течение декады распределено по нормальному закону.
Решение: сначала вычислим выборочную среднюю и выборочную дисперсию, для этого составим вспомогательную таблицу:
Слайд 47

Задача

Задача

Слайд 48

Задача

Задача

Слайд 49

Задача

Задача

Слайд 50

Задача Найдём средние квадратические ошибки:

Задача

Найдём средние квадратические ошибки:

Слайд 51

Задача Подставим их в формулу доверительной вероятности:

Задача

Подставим их в формулу доверительной вероятности:

Слайд 52

Задача Для нахождения доверительного интервала нужно найти предельную ошибку выборки. Используем

Задача

Для нахождения доверительного интервала нужно найти предельную ошибку выборки. Используем

найденные ранее значения средних квадратических ошибок.
Слайд 53

Задача Найдём минимальный объём выборки.

Задача

Найдём минимальный объём выборки.

Слайд 54

Задача Для нахождения теоретических частот составим вспомогательную таблицу

Задача

Для нахождения теоретических частот составим вспомогательную таблицу

Слайд 55

Задача

Задача

Слайд 56

Задача

Задача

Слайд 57

Задача Рассчитаем значение критерия Пирсона:

Задача

Рассчитаем значение критерия Пирсона:

Слайд 58

Задача Найдём по таблице критическое значение критерия Пирсона (число степеней свободы

Задача

Найдём по таблице критическое значение критерия Пирсона (число степеней свободы

k=10, уровень значимости принимается равным 0,05).
Это позволяет утверждать, что при уровне значимости 0,05 опытные данные не противоречат гипотезе о нормальном законе распределения (или опытные данные согласуются с выдвинутой гипотезой).
Слайд 59

Задача Пример 2. Проверяется партия из 5000 консервов. Проверили 10%, среди

Задача

Пример 2. Проверяется партия из 5000 консервов. Проверили 10%, среди

проверенных оказалось 12% просроченных. Найти доверительную вероятность того, что процент годных консервов во всей партии отличается от процента годных в выборке не более, чем на 3% по абсолютной величине.
Найти границы в которых с вероятностью 0,95 заключён процент годных консервов во всей партии.
Слайд 60

Задача Каким должен быть минимальный объём выборки по которой можно было

Задача

Каким должен быть минимальный объём выборки по которой можно было

бы утверждать, что отклонение доли годных консервов не превысит 2,8% по абсолютной величине (рассмотреть повторную и бесповторную выборки).
Слайд 61

Задача Решение: Дано:

Задача

Решение:
Дано:

Слайд 62

Задача Для нахождения доверительного интервала найдём предельные ошибки выборки, используя найденные значения средних квадратических ошибок.

Задача

Для нахождения доверительного интервала найдём предельные ошибки выборки, используя найденные

значения средних квадратических ошибок.
Слайд 63

Задача Найдём минимальный объём выборки:

Задача

Найдём минимальный объём выборки: