Задачи и методы математической статистики. Выборочный метод

Содержание

Слайд 2

План лекции: Задачи и методы математической статистики. Основные понятия выборочного метода.

План лекции:

Задачи и методы математической статистики.
Основные понятия выборочного метода.
Статистическое распределение

выборки. Эмпирическая функция распределения, гистограмма.
Статистические оценки параметров распределения.
Свойства выборочных характеристик.
Слайд 3

Актуальность темы Основные понятия и методы математической статистики необходимы для обработки

Актуальность темы

Основные понятия и методы математической статистики необходимы для обработки результатов

измерений в медицине и биологии
Слайд 4

Теория вероятностей занимается построением и изучением вероятностных моделей случайных явлений. Эти

Теория вероятностей занимается построением и изучением вероятностных моделей случайных явлений. Эти

модели строятся на основе аналитических исследований изучаемых случайных явлений. По вероятностным моделям мы можем рассчитать вероятность любого события изучаемого случайного явления.
Слайд 5

Предмет математической статистики составляет разработка методов регистрации, описания и анализа статистических

Предмет математической статистики составляет разработка методов регистрации, описания и анализа статистических

экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений
Слайд 6

Задачи математической статистики: По результатам случайных экспериментов (выборкам) сделать содержательные выводы

Задачи математической статистики:

По результатам случайных экспериментов (выборкам) сделать содержательные выводы о

вероятностных моделях, адекватно отражающих закономерности изменения замеряемых признаков в изучаемых процессах, явлениях
Слайд 7

Статистика случайных величин (одномерная статистика ) Многомерная статистика (факторный анализ) Временные ряды Математическая статистика (числовые данные)

Статистика случайных величин (одномерная статистика )

Многомерная статистика (факторный анализ)

Временные ряды

Математическая статистика (числовые

данные)
Слайд 8

Задачи одномерной статистики Описательная статистика (представление экспериментальных данных, определение точечных и

Задачи одномерной статистики

Описательная статистика (представление экспериментальных данных, определение точечных и интервальных

оценок)
Проверка статистических гипотез
(о законе распределения, параметрах распределения)
Слайд 9

Основные понятия выборочного метода Наиболее общую совокупность, подлежащих изучению объектов называют

Основные понятия выборочного метода

Наиболее общую совокупность, подлежащих изучению объектов называют генеральной
Выборочной

совокупностью или просто выборкой называют часть генеральной совокупности, случайным образом отобранной для наблюдений
Обьемом совокупности называется число объектов этой совокупности (генеральной или выборочной)
Слайд 10

Выборочные совокупности n 30 n>100 –большие Цель: С помощью статистических методов

Выборочные совокупности

n<30 -малые
30n>100 –большие
Цель: С помощью статистических методов по

свойствам выборки сделать вывод о свойствах генеральной совокупности.
Выборка должна быть репрезентативна (представительна), то есть организована таким образом, чтобы отражать, по-возможности, все интересующие нас свойства генеральной совокупности.
Выборка считается репрезентативной, если каждый объект выборки отобран случайно из генеральной совокупности, то есть все объекты имеют одинаковую вероятность попасть в выборку.
Слайд 11

Повторные Объекты возвращаются в генеральную совокупность Повторные Объекты возвращаются в генеральную

Повторные
Объекты возвращаются в генеральную совокупность

Повторные
Объекты возвращаются в генеральную совокупность

Бесповторные
Объекты не возвращаются

в генеральную совокупность

Выборки

Слайд 12

Отбор, не требующий разделения генеральной совокупности на части: Простой случайный бесповторный

Отбор, не требующий разделения генеральной совокупности на части:
Простой случайный бесповторный

отбор
Простой случайный повторный отбор

Отбор, не требующий разделения генеральной совокупности на части:
Простой случайный бесповторный отбор
Простой случайный повторный отбор

Отбор, при котором генеральная совокупность разбивается на части:
Типический отбор
Механический отбор
Серийный отбор

Способы отбора

Слайд 13

Типический отбор – объекты отбираются не из всей генеральной совокупности, а

Типический отбор – объекты отбираются не из всей генеральной совокупности, а

из каждой ее «типической» части
Механический отбор – генеральная совокупность делится на столько групп, сколько объектов должно войти в выборки и из каждой группы отбирается по одному объекту
Серийный отбор - объекты отбираются из генеральной совокупности не по одному, а сериями
На практике часто используются комбинированные методы
Слайд 14

количественные качественные порядковые (полуколичественные) номинальные бинарные Типы данных

количественные

качественные

порядковые
(полуколичественные)

номинальные

бинарные

Типы данных

Слайд 15

Шкалы измерений Шкала наименований Шкала порядка Шкала интервалов Шкала отношений Мощность шкалы

Шкалы измерений

Шкала наименований

Шкала порядка

Шкала интервалов

Шкала отношений

Мощность шкалы

Слайд 16

Шкалы и допустимые преобразования

Шкалы и допустимые преобразования

Слайд 17

Значения изучаемого признака называются вариантами Последовательность вариант, расположенных в возрастающем порядке

Значения изучаемого признака называются вариантами
Последовательность вариант, расположенных в возрастающем порядке называется

вариационным рядом
Например: 172, 179, 158, 186, 164
Вариационный ряд:
158, 164, 172, 179, 186
Слайд 18

дискретные дискретные непрерывные Статистическим рядом распределения называется набор вариант и соответствующих

дискретные

дискретные

непрерывные

Статистическим рядом распределения называется набор вариант и соответствующих им абсолютных и

относительных частот

Вариационные ряды

Слайд 19

Статистический ряд распределения

Статистический ряд распределения

Слайд 20

Дискретный ряд распределения (индекс КПУ) условие нормировки 2 3 4 4

Дискретный ряд распределения (индекс КПУ)

условие нормировки

2 3 4 4 2 5

4 2 3 3 3 3 5 5 4 4 3 3 4 4 4 4 4 3 3 4 4 4 4 4
n=30
Слайд 21

Дискретный ряд распределения (график)

Дискретный ряд распределения (график)

Слайд 22

Статистическая функция распределения Пусть {х1,…,хn} - выборка наблюдений случайной величины X

Статистическая функция распределения

Пусть {х1,…,хn} - выборка наблюдений случайной величины X с

функцией распределения F(x). Необходимо по выборке оценить функцию распределения.
Определение. Статистической (иногда – эмпирической) функцией распределения случайной величины X называется частота события XF*(x) = m/n,
где m – число Xi, таких, что Xi
Слайд 23

Эмпирическая функция распределения имеет скачки в точках выборки (вариационного ряда), величина

Эмпирическая функция распределения имеет скачки в точках выборки (вариационного ряда), величина

скачка в точке xi равна m/n, где m–количество элементов выборки, совпадающих с xi. Эмпирическая функция распределения по вариационному ряду строится так:
Слайд 24

Функция распределения вероятностей для дискретной случайной величины F*(x)

Функция распределения вероятностей для дискретной случайной величины F*(x)

Слайд 25

Эмпирическая функция распределения

Эмпирическая функция распределения

Слайд 26

Интервальные ряды распределения Ряд распределения студентов по росту 148 158 149

Интервальные ряды распределения

Ряд распределения студентов по росту
148 158 149 162

170 156 189 151 161 152 171 165 174 157 172 172 177 166 157 149 159 154 164 167 173 176 145 163 185 164 161 153 168 162 184 162 169 154 167 163 166 172 158 155 165 179 165 160 159 169
Слайд 27

На практике ряд распределения (вариационный ряд) составляют следующим образом: Из имеющихся

На практике ряд распределения (вариационный ряд) составляют следующим образом:
Из имеющихся значений

признака x выбирают наименьшее (Xmin), наибольшее (Xmax), определяют размах распределения
(Xmax – Xmin).
189-145=44
Определяют число классов группировки. Для определения числа классов можно воспользоваться формулой: k=1+3,32·lg n, где n – число измерений. Величину k округляют до целых чисел (формула Стерджесса). Например, при n=50:
k=1+3,32·lg 50=1+3,32·1,7=6,64≈7
Слайд 28

Интервальные ряды распределения Определяют оптимальную величину класса (интервала группировки) Эту величину

Интервальные ряды распределения

Определяют оптимальную величину класса (интервала группировки)
Эту величину также

можно округлять соответственно точности значений x.
ΔXi=44/4,6 =9,5 ≈10
Выбирают границы классов. Границы первого класса следует выбрать так, чтобы он содержал наименьшее значение, но не начинался с него, например, класс может начинаться с величины (Xmin – ).
Последующие классы образуются добавлением величины интервала ΔXi. Если нижняя граница класса совпадает с верхней границей предыдущего класса, это значение следует отнести к данному классу. Например, [1–2), [2–3) и т.д.
Слайд 29

Статистический ряд распределения студентов по росту

Статистический ряд распределения студентов по росту

Слайд 30

Гистограмма распределения студентов по росту (m, m/n, f(x))

Гистограмма распределения студентов по росту (m, m/n, f(x))

Слайд 31

Эмпирическая функция распределения вероятностей F*(x)

Эмпирическая функция распределения вероятностей F*(x)

Слайд 32

Эмпирическая функция распределения F*(x)

Эмпирическая функция распределения F*(x)

Слайд 33

Статистические оценки параметров распределения Задача: Изучить количественный признак генеральной совокупности. Если

Статистические оценки параметров распределения

Задача: Изучить количественный признак генеральной совокупности.
Если можно теоретически

оценить вид распределения, то необходимо вычислить соответствующие параметры:
Слайд 34

Пусть для изучения признака в генеральной совокупности извлечена выборка объемом n:

Пусть для изучения признака в генеральной совокупности извлечена выборка объемом n:
x1,

x2, x3, …, xn
Статистической оценкой (статистикой) неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин Θn(х1,…,хn)
Слайд 35

Слайд 36

В качестве оценки М(X) используется выборочное среднее: Если значения признака x1,

В качестве оценки М(X) используется выборочное среднее:
Если значения признака x1, x2,

x3, …, xn имеют соответственно частоты m1, m2, m3, …, mn , причем m1+m2+m3+ …+ mn=n
Если все значения признака различны, mi =1:
Средняя арифметическая есть средняя взвешенная значений признака с весами, равными соответствующим частотам
Слайд 37

Отклонением называют разность между значением признака и его средней арифметической Сумма

Отклонением называют разность между значением признака и его средней арифметической
Сумма

произведений отклонений на соответствующие частоты равна 0:
Среднее значение отклонений равно 0:
Слайд 38

Оценкой D(X) служит выборочная дисперсия: 1. 2. Среднее квадратическое отклонение:

Оценкой D(X) служит выборочная дисперсия:
1.
2.
Среднее квадратическое отклонение:

Слайд 39

Асимметрия-скошенность распределения Эксцесс-островершинность распределения Обычно рассматривают безразмерные коэффициенты асимметрии и эксцесса:

Асимметрия-скошенность распределения
Эксцесс-островершинность распределения
Обычно рассматривают безразмерные коэффициенты асимметрии и эксцесса:

Слайд 40

Коэффициент вариации Характеризует относительное значение среднего квадратического отклонения и служит для сравнения разброса несоизмеримых показателей

Коэффициент вариации

Характеризует относительное значение среднего квадратического отклонения и служит для сравнения

разброса несоизмеримых показателей
Слайд 41

Числовые характеристики интервального ряда

Числовые характеристики интервального ряда

Слайд 42

поправка Шеппарда При вычислении выборочной дисперсии для уменьшения ошибки, вызванной группировкой

поправка Шеппарда При вычислении выборочной дисперсии для уменьшения ошибки, вызванной группировкой

(особенно при малом числе интервалов) вычитают из вычисленной дисперсии 1/12 квадрата длины частичного интервала: D'в =Dв-(1/12)h2 D=100 - (1/12)⋅100=91,67
Слайд 43

Коэффициенты асимметрии и эксцесса:

Коэффициенты асимметрии и эксцесса:

Слайд 44

Заключение Нами рассмотрены: Основные понятия выборочного метода; Способы построения дискретных и интервальных вариационных рядов.

Заключение

Нами рассмотрены:
Основные понятия выборочного метода;
Способы построения дискретных и интервальных вариационных рядов.

Слайд 45

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА: Основная литература: Попов А.М. Теория вероятней и математическая статистика

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА:

Основная литература:
Попов А.М. Теория вероятней и математическая статистика /А.М. Попов,

В.Н. Сотников. – М.: ЮРАЙТ, 2011. – 440 с.
Герасимов А. Н. Медицинская статистика: учебное пособие / А. Н. Герасимов. – М. : Мед. информ. агентство, 2007. – 480 с.
Балдин К. В. Основы теории вероятностей и математической статистики : учебник / К. В. Балдин. – М. : Флинта, 2010. – 488с.
Учебно–методические пособия:
Шапиро Л.А., Шилина Н.Г. Руководство к практическим занятиям по медицинской и биологической статистике Красноярск: ООО «Поликом». – 2003.