Математическая статистика (лекция 6)

Содержание

Слайд 2

Проверка распределения на нормальность 1000 случайных значений, распределённых по нормальному закону

Проверка распределения на нормальность

1000 случайных значений, распределённых по нормальному закону с

μ=20 и σ=5
Синяя линия – кривая плотности идеального нормального распределения с μ=20 и σ=5

Любые экспериментальные данные всегда отклоняются от «сферического нормального распределения в вакууме»!

Вероятности, не частоты

Отклонения от идеала

Quantile-Quantile plot (Q-Q Plot)
Квантиль – значение, которое делит упорядоченную выборку на несколько равных частей

Предсказанные значения по норм.распр

Выборочные значения

Середина распределения

Значений здесь больше, чем должно быть для н.р.

Значений здесь меньше, чем должно быть для н.р.

Слайд 3

Формальные тесты на нормальность Визуализация (гистограмма или Q-Q plot) позволяют определить,

Формальные тесты на нормальность

Визуализация (гистограмма или Q-Q plot) позволяют определить, в

каких конкретно точках выборочные значения отклоняются от нормального распределения. При этом Q-Q plot предпочтительней, когда наблюдений мало.
Формальные тесты отвечают на вопрос, нормально ли распределение в принципе.
Тест Шапиро-Уилкса
H0: выборка распределена по нормальному закону (☺)
H1: выборка распределена по нормальному закону (☹)
Если p-value>0,05 – распределение соответствует нормальному закону (☺)
Тест Колмогорова-Смирнова
H0: случайная величина X (значения признака в выборке) имеет распределение F(X) (нормальное распределение – частный случай)
H1: её распределение отличается от F(X)
=> Если p-value>0,05 – случайная величина имеет распределение F(X)
Слайд 4

Почему это важно? Две нормальные выборки: a(n=20,μ=89.9,σ=11.3) и b(n=20,μ=80.7,σ=11.7) Диаграмма типа

Почему это важно?

Две нормальные выборки: a(n=20,μ=89.9,σ=11.3) и b(n=20,μ=80.7,σ=11.7)

Диаграмма типа boxplot

(«ящик с усами»)

медианы

3й квартиль

1й квартиль

выборочный максимум

выборочный минимум

Формальные тесты:
Шапиро-Уилкс
p-value(a)=0,1722
p-value(b)=0,2233
Колмогоров-Смирнов
p-value(a)=0,1626
p-value(b)=0,1595

Тест Стьюдента:
p-value = 0,00112
=>H0 отвергаем
средние не равны!

Слайд 5

Как испортить себе жизнь нормальность? Добавим экстремально отстоящие от выборки значения

Как испортить себе жизнь нормальность?

Добавим экстремально отстоящие от выборки значения (выбросы)

Ещё

один выброс, образованный вследствие сдвига квартилей

Формальные тесты:
Шапиро-Уилкс
p-value(a)=6.725*10-6
p-value(b)=2.202*10-6
Колмогоров-Смирнов
p-value(a)=0,003918
p-value(b)=1.653*10-5

Тест Стьюдента:
p-value = 0,7435
=>H0 не отвергаем
Непарам.аналог:
p-value=0,01167

Слайд 6

Однофакторный дисперсионный анализ Сравниваем между собой не две, а несколько групп

Однофакторный дисперсионный анализ

Сравниваем между собой не две, а несколько групп
Пример. Длина

лепестка у ирисов трёх сортов
Наблюдения делятся на группы по факторному (номинативному) признаку, выраженному независимой переменной
Пример. Все собранные ирисы делятся на три группы – сорт Versicolor, сорт Virginica и сорт Setosa. Переменная «сорт ириса» – независимая переменная.
Изучаем зависимую переменную – количественную переменную, выраженность которой зависит от независимой.
Пример. Зависимая переменная – длина лепестка ириса.

Versicolor

Virginica

Setosa

Задача: зависит ли длина лепестка ириса от того, к какому сорту он принадлежит?

Слайд 7

Условный пример

Условный пример

 

Слайд 8

Ещё об общей сумме квадратов SSB SSW total between within Сумма

Ещё об общей сумме квадратов

SSB

SSW

total

between

within

Сумма квадратов отклонений между группами

Сумма квадратов отклонений

внутри групп

 

 

SST

число элементов в группе

Слайд 9

Итак, Назад, к статистике: SSB и SSW – это случайные величины,

Итак,
Назад, к статистике: SSB и SSW – это случайные величины, имеющие

распределение χ2 (представляют собой суммы квадратов нормальных с.в.). Если скорректировать их на число степеней свободы и поделить SSB на SSW, получим с.в., распределённую по закону Фишера. Для SSB ч.с.св. = числу групп – 1, для SSW = числу наблюдений – число групп.

SSB

SSW

total

between

within

Сумма квадратов отклонений между группами

Сумма квадратов отклонений внутри групп

SST

6

24

30

БОльшая часть общей изменчивости обеспечивается изменчивостью между группами, значит, группы-таки различаются между собой

Плотность распределения f(x)

 

Слайд 10

Число групп Число наблюдений (в целом) F-значение Смысл F-значения: показывает, во

 

Число групп

Число наблюдений (в целом)

F-значение

Смысл F-значения: показывает, во сколько раз межгрупповая

вариабельность превышает внутригрупповую

 

Вероятность того, что межгрупповая вариабельность будет превышать внутригрупповую в 12 и более раз при условии равенства средних

Плотность F-распределения при k1=2 и k2=6

Слайд 11

Задача Независ.пер. SSB m-1 SSB/(m-1) N-m SSW SSW/(N-m) F-значение Ур-нь значимости

Задача

 

Независ.пер.

SSB

m-1

SSB/(m-1)

N-m

SSW

SSW/(N-m)

F-значение

Ур-нь значимости

Слайд 12

Множественные сравнения

Множественные сравнения

 

Слайд 13

Что же делать? Поправка на множественное сравнение Бонферрони. Идея. Вероятность совершения

Что же делать?

Поправка на множественное сравнение Бонферрони.
Идея. Вероятность совершения ошибки

первого рода растёт пропорционально увеличению числа попарных сравнений. Почему бы не уравновесить этот рост с помощью корректировки критического p-value в сторону убывания?
А именно, разделим критическое значение p-value на число попарных сравнений: 0,05/6=0,008333. Тогда вероятность того, что в 6ти тестах будет совершена хотя бы одна ошибка 1го рода = 1-(1-0,008333)6 =0,049.
НО! Сильное снижение критического уровня p-value ведёт к увеличению вероятности совершить ошибку 2го рода (H0 не отвергается, хотя должна была бы).
Альтернатива – использование критерия Тьюки (критерий достоверно значимой разности Тьюки,  Tukey's honestly significant difference test, Tukey's HSD test)
- похож на критерий Стьюдента, но стандартная ошибка среднего рассчитывается по-другому
Слайд 14

Критерий Тьюки средняя внутригрупповая сумма квадратов Число наблюдений в группе A

Критерий Тьюки

 

средняя внутригрупповая сумма квадратов

Число наблюдений в группе A (B)

разность

средних

дов.инт-л

ур-нь значимости

Стат.значимые рез-ты (дов.инт-л не включает 0)

Слайд 15

Двухфакторный дисперсионный анализ Не одна независимая переменная, а две. Пример. Уровень

Двухфакторный дисперсионный анализ

Не одна независимая переменная, а две.
Пример. Уровень экспрессии гена

в зависимости от дозировки лекарств (высокая/низкая) и возраста пациента (молодой/пожилой).
Результат дисперсионного анализа:
В отличие от однофакторного, SST=SSW+SSBA+SSBB+SSBA+B

Изменчивость, обусловленная взаимодействием факторов

Слайд 16

Как это выглядит? Фокус-группа из 100 мужчин и 100 женщин оценивает

Как это выглядит?

Фокус-группа из 100 мужчин и 100 женщин оценивает два

телефона (модель №1 и модель №2) по 100-балльной шкале. Независимые переменные (факторы) – пол и модель телефона, зависимая переменная – оценка телефона по 100-балльной шкале.
A – значимый эффект только фактора «модель телефона» (и М, и Ж больше нравится 1я модель)
B – значимый эффект только фактора пола (женщинам в принципе больше нравятся телефоны)
Слайд 17

Как это выглядит? C – значимый эффект обоих факторов (женщинам в

Как это выглядит?

C – значимый эффект обоих факторов (женщинам в принципе

больше, чем мужчинам, нравятся телефоны, но при этом и те, и другие более высоко оценили 1ю модель)
D – значимое взаимодействие факторов (мужчины оценили вторую модель выше, чем первую, а женщины – наоборот). Т.е. влияние одного фактора на зависимую переменную проявляется по-разному в зависимости от того, какое значение примет другая независимая переменная.
Слайд 18

Требования к использованию дисперсионного анализа Нормальность распределения зависимой переменной в каждой

Требования к использованию дисперсионного анализа

Нормальность распределения зависимой переменной в каждой из

групп
Гомогенность дисперсий (дисперсии признака внутри групп равны между собой)
Могут нарушаться при большом объёме выборок (>50).
Нормальность распределения проверяется:
Графически (гистограмма плотности вероятностей, qq-plot)
Формальными тестами (Шапиро-Уилкса, Колмогорова-Смирнова)
Гомогенность дисперсий проверяется:
Графически (боксплот)
Формальными тестами (тест Левена, при p>0,05 дисперсии одинаковы)
Слайд 19

Резюме по сравнению средних Для сравнения средних значений в двух группах

Резюме по сравнению средних

Для сравнения средних значений в двух группах –

t-test
Для сравнения средних в трёх и более группах – дисперсионный анализ
Если результаты дисперсионного анализа говорят, что по крайней мере в двух группах средние различны, – использовать критерий Тьюки