Теория вероятностей. Элементы математической статистики (лекция 8)

Содержание

Слайд 2

Теория вероятностей УГТУ-УПИ 2008г. М.А.Вигура, О.А.Кеда, А.Ф.Рыбалко, Н.М.Рыбалко, А.Б.Соболев Лекция 8 ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Теория вероятностей

УГТУ-УПИ
2008г.

М.А.Вигура, О.А.Кеда, А.Ф.Рыбалко,
Н.М.Рыбалко, А.Б.Соболев
Лекция 8
ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Слайд 3

Цель лекции: 1. Овладеть соответствующим математическим аппаратом для дальнейшего изучения курса

Цель лекции:

1. Овладеть соответствующим математическим аппаратом для дальнейшего изучения курса математики,

демонстрировать и использовать математические методы в ходе изучения специальных дисциплин для будущей профессиональной деятельности. 2. Ознакомиться с основными понятиями математической статистики, со способами представления данных выборки и с вычислением численных характеристик выборки.
Слайд 4

Формируемые компетенции по ФГОС:

Формируемые компетенции по ФГОС:

Слайд 5

Лекция 8 ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Лекция 8

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Слайд 6

Математическая статистика – раздел математики, изучающий методы сбора и анализа результатов

Математическая статистика – раздел математики, изучающий методы сбора и анализа результатов

наблюдений массовых случайных явлений с целью выявления существующих закономерностей.

. Задачи математической статистики

Слайд 7

Слайд 8

результаты наблюдений (экспериментов) процесс наблюдений может корректироваться на основании предварительных результатов

результаты наблюдений (экспериментов)
процесс наблюдений может корректироваться на основании предварительных результатов
(последовательный

анализ)

Источники информации

априорная (доопытная) информация о свойствах изучаемого объекта, накопленная к текущему моменту.
Эта информация отражается в статистической модели, выбираемой при решении задачи.

Слайд 9

Следует заметить, что степень обоснованности применения априорной информации зависит от компетентности

Следует заметить, что степень обоснованности применения априорной информации зависит от компетентности

и добросовестности конкретного исследователя и неверные исходные допущения могут существенно исказить результат статистического анализа.
Слайд 10

. Частые задачи математической статистики Предварительная обработка данных упорядочение результатов наблюдения

. Частые задачи математической статистики

Предварительная обработка данных упорядочение результатов наблюдения

или эксперимента, представление их в обозримом виде.

Оценка неизвестной величины
(вероятности события, функции распределения случайной величины, параметров распределения, степени взаимозависимости двух или нескольких случайных величин и т.п.).

Проверка статистических гипотез
(о виде функции распределения, о вероятности события и т.п.), т.е., установление меры надежности оценки, сделанной на основании опытных данных.

Установление формы и степени связи между случайными величинами.

Слайд 11

Современная математическая статистика может быть определена как теория принятия решений в

Современная математическая статистика может быть определена как теория принятия решений в

условиях неопределенности.
Она включает в себя также методы определения числа наблюдений, необходимых для достаточно надежной оценки,
до начала исследований (планирование эксперимента)
или в процессе исследований (последовательный анализ),
что позволяет уже на этапе сбора информации уменьшить объем собираемых данных без снижения надежности оценок.
Слайд 12

Генеральная и выборочная совокупности. Способы отбора Если нужно изучить, как в

Генеральная и выборочная совокупности. Способы отбора

Если нужно изучить, как в

совокупности однородных объектов распределен некоторый признак, характеризующий эти объекты, не всегда возможно исследовать каждый объект (объектов может быть слишком много, при проверке объект может быть уничтожен, и т.п.).
В этих случаях отбирают часть объектов и по свойствам отобранных объектов судят о свойствах всех объектов.
Слайд 13

Основные определения Выборкой или выборочной совокупностью называют совокупность случайно отобранных объектов.

Основные определения

Выборкой или выборочной совокупностью называют совокупность случайно отобранных объектов.
Генеральной

совокупностью называют исходное множество объектов, из которого производится выборка.
Объем совокупности (выборочной или генеральной) – число элементов данного множества.
Слайд 14

Для упрощения вычислений при очень большом объеме генеральной совокупности часто принимают,

Для упрощения вычислений при очень большом объеме генеральной совокупности часто

принимают, что ее объем бесконечен. Подобное допущение основано на законе больших чисел, погрешность, им вносимая, практически не сказывается на характеристиках выборки.
Слайд 15

Выборка называется повторной, если случайно отобранный для обследования объект возвращается в

Выборка называется повторной, если случайно отобранный для обследования объект возвращается в

генеральную совокупность перед отбором следующего объекта.
В противном случае выборка называется бесповторной .
Слайд 16

Чтобы по данным выборки можно было судить о всей совокупности, необходимо,

Чтобы по данным выборки можно было судить о всей совокупности, необходимо,

чтобы члены выборки представляли ее достаточно правильно.
Такая выборка называется репрезентативной (представительной).
Слайд 17

1) случайный отбор элементов совокупности, 2) равновероятность попадания в выборку любого

1) случайный отбор элементов совокупности,
2) равновероятность попадания в выборку любого элемента

генеральной совокупности,
3) достаточно большой объем выборки

Для того, чтобы выборка была
репрезентативной, необходимы:

Слайд 18

Если элементы извлекаются по одному из генеральной совокупности, говорят о простом

Если элементы извлекаются по одному из генеральной совокупности, говорят о простом

случайном отборе (может быть повторным и бесповторным).
Если из генеральной совокупности элементы разбиваются на группы, “серии”, серия отбирается случайно и подвергается сплошной проверке, отбор называется серийным.
Слайд 19

Типический отбор осуществляется следующим образом: генеральная совокупность делится на “типические” части,

Типический отбор осуществляется следующим образом: генеральная совокупность делится на “типические” части,

из каждой части производится случайный отбор.

Механический отбор осуществляется через регулярные интервалы Для обеспечения репрезентативности при механическом отборе необходим контроль периодичности.

Возможны также произвольные
комбинации способов отбора.

Слайд 20

Статистическое распределение выборки

Статистическое распределение выборки

Слайд 21

статистическим распределением выборки или статистическим рядом Называется перечень вариант и соответствующих им частот (или относительных частот)

статистическим распределением выборки или статистическим рядом
Называется перечень вариант и

соответствующих им частот
(или относительных частот)
Слайд 22

пример При 100 подбрасываниях игральной кости на верхней грани единица выпала

пример

При 100 подбрасываниях игральной кости на верхней грани единица выпала 22

раза, двойка -16 , тройка - 13, четверка -24 , пятерка -12 и, наконец, шестерка – 13 раз. Считая число выпавших очков случайной величиной, построить для нее статистический ряд.
Слайд 23

В том случае, если число значений случайной величины X велико, или

В том случае, если число значений случайной величины X велико, или

есть основания полагать, что случайная величина является непрерывной и может принять любое значение из некоторого промежутка, строят интервальный статистический ряд.
Слайд 24

Значения вариант группируют по промежуткам (обычно одинаковой длины), в первой строке

Значения вариант группируют по промежуткам (обычно одинаковой длины), в первой строке

указывается промежуток, во второй – число наблюдений, попавших в данный промежуток.
Слайд 25

интервальный статистический ряд Значения вариант группируют по промежуткам (обычно одинаковой длины),

интервальный статистический ряд

Значения вариант группируют по промежуткам (обычно одинаковой

длины),
в первой строке указывается промежуток, во второй – число наблюдений, попавших в данный промежуток.
Для определения оптимальной длины частичного промежутка можно использовать формулу Стерджеса. Пусть значения случайной величины X располагаются на отрезке , объем выборки – n.
Длина частичного интервала ,
число интервалов (берется
ближайшее к целому), первый интервал начинается в точке
Слайд 26

пример Пусть измерен рост 50 случайно выбранных человек с точностью до

пример

Пусть измерен рост 50 случайно выбранных человек с точностью до 1

см (результаты приведены ниже).
175, 179, 170, 163, 159, 171, 170, 152, 168, 172, 160, 167, 165, 167, 156, 170, 181, 153, 163, 167, 179, 172, 170, 186, 180, 187, 178, 175, 168, 168, 171, 173, 178, 170, 183, 181, 180, 160, 165, 158, 173, 160, 167, 172, 180, 169, 168, 170, 188, 176.

Рост является непрерывной случайной величиной, но в силу ограниченной точности измерений любые значения этой величины будут принадлежать некоторому дискретному множеству.
Значения роста в выборке изменяются от 152 см до 188 см, т.е., принимают 37 значений, объем выборки – 50 человек.
Нахождение статистических характеристик данной выборки в таком виде представляет заметные вычислительные трудности.

Слайд 27

Упорядочим данные выборки по возрастанию (ранжируем выборку): 152, 153, 156, 158,

Упорядочим данные выборки по возрастанию (ранжируем выборку):

152, 153, 156, 158,

159, 160, 160, 160, 163, 163, 165, 165, 167, 167, 167, 167, 168, 168, 168, 168, 169, 170, 170, 170, 170, 170, 170, 171, 171, 172, 172, 172, 173, 173, 175, 175, 176, 178, 178, 179, 179, 180, 180, 180, 181, 181, 183, 186, 187, 188.
Слайд 28

Построим интервальный статистический ряд.

Построим интервальный статистический ряд.

Слайд 29

Полигон и гистограмма Для наглядности часто используют графические изображения статистических рядов:

Полигон и гистограмма

Для наглядности часто используют графические изображения статистических

рядов:
для дискретного ряда - полигон,
для интервального ряда - гистограмму.
Слайд 30

Полигон частот (относительных частот)

Полигон частот (относительных частот)


Слайд 31

Гистограмма частот (относительных частот)

Гистограмма частот (относительных частот)


Слайд 32

Эмпирическая функция распределения

Эмпирическая функция распределения


Слайд 33

Эмпирической функцией распределения (функцией распределения выборки) называется относительная частота события где


Эмпирической функцией распределения (функцией распределения
выборки) называется
относительная частота события


где – число вариант, меньших x , n –
объем выборки.
Слайд 34

Теоретической функцией распределения называется функция распределения F(x) случайной величины X, вычисленная


Теоретической функцией распределения
называется функция распределения F(x)
случайной величины X,

вычисленная по
генеральной совокупности, т.е.,
вероятность события {X
Слайд 35

При возрастании объема выборки различия между и уменьшаются.


При возрастании объема
выборки различия между
и уменьшаются.

Слайд 36

теорема (Гливенко) При неограниченном возрастании объема выборки эмпирическая функция распределения сходится

теорема (Гливенко)


При неограниченном возрастании
объема выборки эмпирическая

функция
распределения сходится по
вероятности к теоретической функции
распределения
Слайд 37

пример Построим эмпирическую функцию распределения для ранее рассмотренного примера (подбрасывание кости). Распределение приведено ниже.

пример

Построим эмпирическую функцию распределения для ранее рассмотренного примера (подбрасывание

кости). Распределение приведено ниже.
Слайд 38

Построим эмпирическую функцию распределения

Построим эмпирическую функцию распределения


Слайд 39

Числовые характеристики статистического распределения выборки Пусть имеется генеральная совокупность объема N,

Числовые характеристики статистического распределения выборки


Пусть имеется генеральная

совокупность объема N, из которой сделана выборка объема n. Статистический ряд, в котором присутствуют значения случайной величины X и относительные частоты их появления, можно рассматривать как закон распределения новой случайной величины XВ (исходную величину переобозначим как ХГ). Очевидно, законы распределения этих величин в какой-то мере близки, но не совпадают.
Слайд 40

Каждой числовой характеристике случайной величины ХГ соответствует ее выборочный аналог –

Каждой числовой характеристике случайной величины ХГ соответствует ее выборочный аналог –

характеристика случайной величины XВ.
При возрастании объема выборки числовые характеристики XВ будут сходиться по вероятности к соответствующим характеристикам ХГ.

Замечание

Слайд 41

Выборочное среднее – среднее арифметическое значений выборки числовые характеристики выборки

Выборочное среднее – среднее арифметическое значений выборки

числовые характеристики выборки


Слайд 42

Выборочное среднее – среднее арифметическое значений выборки числовые характеристики выборки

Выборочное среднее – среднее арифметическое значений выборки

числовые характеристики выборки


Слайд 43

Выборочная мода – наиболее вероятное значение в выборке (варианта с наибольшей

Выборочная мода – наиболее вероятное значение в выборке (варианта с

наибольшей частотой).
Выборочная медиана – значение случайной величины, приходящееся на середину вариационного ряда. Если объем выборки
четен, n=2m, то,
если нечетен, n=2m+1, то
.

числовые характеристики выборки

Слайд 44

Выборочная дисперсия – среднее значение квадрата отклонения числовые характеристики выборки Эта

Выборочная дисперсия – среднее значение квадрата отклонения

числовые характеристики выборки

Эта

формула может быть преобразована к виду
Слайд 45

Выборочное среднее квадратическое отклонение Исправленная выборочная дисперсия Исправленное выборочное среднее квадратическое отклонение числовые характеристики выборки

Выборочное среднее квадратическое отклонение
Исправленная выборочная дисперсия
Исправленное выборочное среднее

квадратическое отклонение

числовые характеристики выборки

Слайд 46

Числовые характеристики генеральной совокупности Генеральное среднее – среднее арифметическое значений признака X генеральной совокупности:

Числовые характеристики генеральной совокупности

Генеральное среднее – среднее арифметическое значений

признака X генеральной совокупности:
Слайд 47

Числовые характеристики генеральной совокупности Генеральная дисперсия – среднее по генеральной совокупности значение квадрата отклонения

Числовые характеристики генеральной совокупности

Генеральная дисперсия – среднее по генеральной

совокупности значение квадрата отклонения
Слайд 48

Числовые характеристики генеральной совокупности Генеральное среднее квадратическое отклонение (стандартное отклонение )

Числовые характеристики генеральной совокупности

Генеральное среднее квадратическое отклонение (стандартное отклонение

)
Слайд 49

В результате студент должен: владеть основными понятиями математической статистики; уметь преобразовывать

В результате студент должен:

владеть основными понятиями математической статистики; уметь преобразовывать выборочные данные

к виду, удобному для дальнейшей обработки; уметь вычислять численные характеристики выборки.