Описательная статистика. Параметры распределения

Содержание

Слайд 2

Асимметрия, эксцесс, модальность Распределение оценок студентов по разным разделам дисциплины: А

Асимметрия, эксцесс, модальность

Распределение оценок студентов по разным разделам дисциплины:
А – отрицательная

асимметрия, В – положительная асимметрия, С – симметричное распределение, D – отрицательный эксцесс, E – положительный эксцесс, F – бимодальное распределения
Слайд 3

Параметры главной тенденции: «Каково типичное значение признака для данного распределения?» Среднее значение Мода Медиана

Параметры главной тенденции:

«Каково типичное значение признака для данного распределения?»
Среднее значение
Мода
Медиана

Слайд 4

Среднее значение

Среднее значение

Слайд 5

Медиана (Ме) Для нахождения медианы необходимо упорядочить выборку по возрастанию и

Медиана (Ме)

Для нахождения медианы необходимо упорядочить выборку по возрастанию и найти

элемент, стоящий посередине вариационного ряда
Если n – нечетное число, то медианой будет элемент с номером i= (n+1)/2 в упорядоченном по возрастанию ряду. Например, в выборке объемом 7 медианой будет 4 элемент вариационного ряда:
3,1 3,8 4,2 5,7 6,3 7,2 7,9 Ме = х4 = 5,7
Если n – четное число, то медианой будет среднее значение двух элементов вариационного ряда с номерами i=n/2 и j=n/2+1. Например, при n=10 медианой будет среднее арифметическое 5 и 6 элементов вариационного ряда:
3,1 3,8 4,2 5,7 6,3 7,5 7,9 8,4 8,5 9,2
Ме = (х5 + х6)/2 = (6,3+7,5)/2 = 6,9
Слайд 6

Параметры разброса Определяют различия в значениях признака у разных объектов Размах

Параметры разброса

Определяют различия в значениях признака у разных объектов
Размах вариации
Дисперсия
Стандартное отклонение
Коэффициент

вариации
Слайд 7

Дисперсия Выборочная дисперсия: Дисперсия генеральной совокупности:

Дисперсия

Выборочная дисперсия:

Дисперсия генеральной совокупности:

Слайд 8

Стандартное отклонение Коэффициент вариации V

Стандартное отклонение
Коэффициент вариации
V<33% выборка однородная

Слайд 9

Стандартная ошибка среднего Разные выборки дают разные оценки параметров распределения. Для

Стандартная ошибка среднего

Разные выборки дают разные оценки параметров распределения. Для характеристики

точности выборочных оценок используют стандартную ошибку среднего:
Не является параметром разброса, только показывает точность оценки среднего. Чем больше выборка, тем меньше ошибка и выше точность
Слайд 10

Процентили 25-ый и 75-ый процентили (квартили) отсекают от распределения по четверти,

Процентили

25-ый и 75-ый процентили (квартили) отсекают от распределения по четверти, т.е.

одна четверть значений распределения будет не больше 25-го процентиля, а одна четверть – больше 75-го процентиля. Медиана – это 50-ый процентиль.
3,1 3,8 4,2 5,7 6,3 7,5 7,9 8,4 8,5 9,2
25% = 4,2
75% = 8,4
Слайд 11

Нормальное распределение

Нормальное распределение

Слайд 12

Свойства нормального распределения Полностью определяется средним значением и стандартным отклонением Мода,

Свойства нормального распределения

Полностью определяется средним значением и стандартным отклонением
Мода, медиана и

среднее значение совпадают
Среднее значение характеризует положение кривой распределения и место ее максимума
Стандартное отклонение характеризует форму кривой
Зная среднее и стандартное отклонение, ориентировочно можно указать интервал практически всех значений изучаемой величины.
Слайд 13

Распределение по росту

Распределение по росту

Слайд 14

Симметричное и асимметричные распределения

Симметричное и асимметричные распределения

Слайд 15

Способы проверки соответствия распределения нормальному закону 1) Способы, основанные на визуальной

Способы проверки соответствия распределения нормальному закону

1) Способы, основанные на визуальной оценке

близости распределения признака к нормальному:
построение гистограммы распределения признака
построение графика функции распределения признака
2) Вычисление коэффициентов асимметрии и эксцесса. Для нормального распределения эти показатели равны 0.
3) Вычисление среднего, моды, медианы и процентилей
4) Статистические критерии для проверки нормальности распределения (Пирсона, Колмогорова-Смирнова, Лиллиефорса (Lilliefors), Шапиро-Уилка (Shapiro–Wilk).
Слайд 16

Проверка соответствия распределения нормальному закону 1) выборочные среднее, медиана и мода

Проверка соответствия распределения нормальному закону

1) выборочные среднее, медиана и мода должны

быть близки по значению и находиться примерно посередине между 25 и 75 процентилями;
2) интервал среднее ± два стандартных отклонения должен включать примерно 95% значений выборки и не должен содержать много значений, которых не может быть в данном распределении (например, отрицательных, если речь идет о данных, которые могут принимать только положительные значения).
Слайд 17

Часто ли встречается нормальное распределение? Можно сказать, что из всех распределений

Часто ли встречается нормальное распределение?

Можно сказать, что из всех распределений в

природе чаще всего встречается именно нормальное распределение – отсюда и произошло его название.
Но для данных биомедицинских исследований это не всегда верно. Нормальное распределение встречается в биомедицинских признаках примерно в 20-25% (???).
До тех пор пока выборка достаточно большая (например, 30 (100) или больше наблюдений), можно считать, что выборочное распределение нормально (???).
Слайд 18

Слайд 19

Как правильно использовать параметры распределения для описания данных? Купе № 1:

Как правильно использовать параметры распределения для описания данных?

Купе № 1:

пассажиры возраста 19, 20, 21 год
Купе №2: пассажиры возраста 54, 2 и 4 года
Каков средний возраст пассажиров каждого купе?
Слайд 20

Пример: распределение возраста пациентов, заболевших менингитом, вызванным гемофильной палочкой 1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,20,50,71 n=23

Пример: распределение возраста пациентов, заболевших менингитом, вызванным гемофильной палочкой

1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,20,50,71
n=23
Среднее

= 7,
Стандартное отклонение = 17,6
Медиана = 1,
Мода = 1,
25 процентиль = 1,
75 процентиль = 1.
Слайд 21

Описание количественных данных в зависимости от вида их распределения Для описания

Описание количественных данных в зависимости от вида их распределения

Для описания выборочного

нормального распределения количественных признаков необходимо указывать: число наблюдений, среднее значение, стандартное отклонение.
Для описания выборочного распределения количественных признаков, которое отличается от нормального, рекомендуется указывать: число наблюдений, медиану, 25 и 75 процентили (нижний и верхний квартили).
Слайд 22

1: 21, 22, 22, 23, 23, 24, 24, 24, 25, 25,

1: 21, 22, 22, 23, 23, 24, 24, 24, 25, 25,

25, 25, 26, 26, 26, 26, 27, 27, 28, 29, 30 2: 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 21, 21, 21, 33, 34, 34, 36, 37, 42

n1=n2=21
Среднее 1= 25,14;
Ст. отклон.1 = 2,31;
Медиана = 25; Мода=25 и 26
Среднее 2= 25,00;
Ст. отклон.2 = 7,32;
Медиана = 21; Мода 21

Слайд 23

Визуальное представление 1 и 2 распределения

Визуальное представление 1 и 2 распределения

Слайд 24

Примеры взаимного расположения параметров для разных видов распределений

Примеры взаимного расположения параметров для разных видов распределений

Слайд 25

Пример Найти параметры следующего выборочного распределения (клинические оценки тяжести серповидноклеточной анемии):

Пример

Найти параметры следующего выборочного распределения (клинические оценки тяжести серповидноклеточной анемии):
0 0

0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 3 3 3 3 4 4 5 5 5 5 6 7 9 10 11
Можно ли считать, что выборка извлечена из совокупности с нормальным распределением?
Слайд 26

Таблица для расчета параметров распределения

Таблица для расчета параметров распределения

Слайд 27

n= 33 Mo=1 (p=11) Me=x(33+1)/2 =x17= 2 n/4=33/4=8,25≈8 25%=x8= 1 3/4=3*33/4=24,75≈25 75%=x25=5 3,09-2*2,89=-2,69; 3,09+2*2,89=8,87 Интервал: -2,69÷8,87

n= 33
Mo=1 (p=11)
Me=x(33+1)/2 =x17= 2
n/4=33/4=8,25≈8
25%=x8= 1
3/4=3*33/4=24,75≈25
75%=x25=5
3,09-2*2,89=-2,69;
3,09+2*2,89=8,87
Интервал: -2,69÷8,87