Множественные сравнения

Содержание

Слайд 2

Вероятность ошибиться хотя бы в одном из сравнений: p=1–(1–0,05)k, где k

Вероятность ошибиться хотя бы в одном из сравнений:

p=1–(1–0,05)k,
где k –

число парных сравнений
~ p=0,05∙k
k=3; p=0,05⋅3=0,15
Слайд 3

7. Lee K. L. et al. Clinical judgment and statistics. Lessons

7. Lee K. L. et al. Clinical judgment and statistics. Lessons

from a simulated randomized trial in coronary artery disease / K. K. Lee, J. F. McNeer, C. F. Starmer et al. // Circulation. – 1980. – Vol. 61. – N 3. – P. 508–515.

Симуляция изучения эффективности двух различных методов лечения ишемической болезни сердца.
Две равные группы, одно и то же лечение!
Данные были обработаны так, как будто бы одной группе назначалось лечение А, а другой – лечение Б.
При сравнении эффективности ≪двух видов лечения≫ различий обнаружено не было.
Разбили каждую из групп пациентов еще на 6 по количеству пораженных коронарных артерий (1, 2 или 3 сосуда) и сократительной способности миокарда левого желудочка (выше или ниже определенного критического уровня).
Результаты лечения не различались в пяти подгруппах, а в подгруппе пациентов с наиболее тяжелой формой заболевания лечение А было более эффективно (р = 0,025).
Но в действительности обе группы получали одно и то же лечение!

Слайд 4

Поправка Бонферрони Если мы хотим обеспечить вероятность ошибки первого рода α,

Поправка Бонферрони

Если мы хотим обеспечить вероятность ошибки первого рода α, то

в каждом из сравнений мы должны принять уровень значимости α/k, где k – число попарных сравнений
При сравнении нескольких групп с одной контрольной k=m-1, где m – количество групп.
Множественные парные сравнения групп и подгрупп обоснованы, если они запланированы в начале исследования, до начала сбора данных!
Слайд 5

Три случайные выборки из одной совокупности: N=200, μ=40, σ=5

Три случайные выборки из одной совокупности:

N=200, μ=40, σ=5

Слайд 6

плацебо-тестостерон t=2,39; плацебо - эстрадиол t=0,93; тестостерон - эстрадиол t=1,34. ν=


плацебо-тестостерон t=2,39;
плацебо - эстрадиол t=0,93;
тестостерон - эстрадиол t=1,34.
ν=

10+10-2=18, t0,05;18=2,101.
k=3, α=0,05/3=0,017
t0,02;18=2,552 > 2,39 нет значимых различий!
Слайд 7

В. Савельев «СТАТИСТИКА И КОТИКИ» http://www.statcats.ru https://lib.rus.ec/b/624980

В. Савельев «СТАТИСТИКА И КОТИКИ»
http://www.statcats.ru
https://lib.rus.ec/b/624980

Слайд 8

Критерий Стьюдента для сравнения средних в двух взаимосвязанных выборках (Парный критерий

Критерий Стьюдента для сравнения средних в двух взаимосвязанных выборках

(Парный критерий Стьюдента,

критерий Стьюдента для повторных измерений)
Слайд 9

Выборки называются независимыми (несвязанными), если процедура эксперимента и полученные результаты измерения

Выборки называются независимыми (несвязанными), если процедура эксперимента и полученные результаты измерения

некоторого признака у испытуемых одной выборки не оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же признака у испытуемых другой выборки.
И, напротив, выборки называется зависимыми (связанными) если процедура эксперимента и полученные результаты измерения некоторого свойства, проведенные на одной выборке, оказывают влияние на другую.
Слайд 10

В зависимых выборках одному случаю из первой выборки соответствует один случай

В зависимых выборках одному случаю из первой выборки соответствует один случай

из второй выборки и наоборот. Примеры зависимых выборок:
пары близнецов;
два измерения какого-либо признака до и после экспериментального воздействия,
мужья и жёны
родители и дети и т.д.
Зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться
Слайд 11

Пример. Некий исследователь выдвинул «гипотезу» о том, что люди выше, когда

Пример. Некий исследователь выдвинул «гипотезу» о том, что люди выше, когда

они в обуви, чем когда они босиком.
Схема эксперимента: в случайной выборке из 15 взрослых людей измерили рост каждого в обуви и без нее.
Слайд 12

XA=167,7; sA=12,03; XB=163,7; sB= 12,7 t = 0,89. Для уровня значимости

XA=167,7; sA=12,03; XB=163,7; sB= 12,7
t = 0,89. Для уровня значимости α=0,05

и числа степеней свободы ν=28 критическое значение t равно 2,05. Рассчитанное значение меньше критического. Различия не являются статистически значимыми???
Слайд 13

Причина: разность средних (равна 4) очень мала по сравнению с разбросом

Причина: разность средних (равна 4) очень мала по сравнению с разбросом

значений в каждой из выборок (стандартное отклонение 12,03 и 12,17)
На самом деле нас интересует только разница между двумя группами. Здесь есть только одна выборка D: разность между двумя измерениями.
Н0 – среднее значение в выборке не отличается от 0
Н1 – среднее значение в выборке отличается от 0
Слайд 14

Число степеней свободы ν=n-1 sD=1,1 t=13,85; ν=14; t0,05= 2,145; t0,001=4,14


Число степеней свободы ν=n-1
sD=1,1
t=13,85; ν=14; t0,05= 2,145; t0,001=4,14

Слайд 15

Часто значительная часть внутригрупповой изменчивости (вариации) в обеих группах может быть

Часто значительная часть внутригрупповой изменчивости (вариации) в обеих группах может быть

объяснена индивидуальными различиями субъектов.
В случае независимых выборок нельзя определить (или «удалить») часть вариации, связанную с индивидуальными различиями субъектов.
Если та же самая выборка тестируется дважды, то можно легко исключить эту часть вариации.
Слайд 16

Пример. Проводилось изучение суточного диуреза у 10 человек после приема препарата

Пример. Проводилось изучение суточного диуреза у 10 человек после приема препарата

и у 10 после приема плацебо.

Xк = 1330 мл
sк=353,7 мл
X э = 1412 мл
sэ= 356,1 мл
t=0,52 – нет значимых различий

Слайд 17

sD = 97,84 t=2,65 Различия статистически значимы Условие применения: нормальное распределение разности между парами значений


sD = 97,84
t=2,65
Различия статистически значимы
Условие применения: нормальное распределение разности между парами

значений
Слайд 18

Если схема эксперимента предполагает не две, а три и более групп?

Если схема эксперимента предполагает не две, а три и более групп?


Попарные сравнения групп–
проблема множественных сравнений!!!
Слайд 19

Дисперсионный анализ (ANOVA – analysis of variance) Разработан в 20-х годах

Дисперсионный анализ (ANOVA – analysis of variance)

Разработан в 20-х годах прошлого

века английским математиком и генетиком Р.Фишером
Выявляет статистически значимые различия между несколькими группами
Значение критерия - отношение межгрупповой вариации к внутригрупповой
Слайд 20

Пример. Ученые исследовали влияние диеты на сердечный выброс. Случайным образом отобрали

Пример. Ученые исследовали влияние диеты на сердечный выброс. Случайным образом отобрали

28 человек и разделили их на 4 группы по 7 человек в каждой. Члены первой (контрольной) группы продолжали питаться как обычно, второй – ели преимущественно макароны, третьей – мясо, четвертой – фрукты. Через месяц у всех участников эксперимента измерили сердечный выброс.
Слайд 21

Нулевая гипотеза: ни одна из диет не влияет на сердечный выброс. Как убедиться в этом?

Нулевая гипотеза: ни одна из диет не влияет на сердечный выброс.

Как убедиться в этом?
Слайд 22

Оценка дисперсии совокупности: 1) на основании дисперсий в каждой группе. Такая

Оценка дисперсии совокупности:

1) на основании дисперсий в каждой группе. Такая оценка

не зависит от различий групповых средних.
2) по разбросу выборочных средних. Такая оценка зависит от различий выборочных средних.
Если экспериментальные группы являются случайными выборками из одной и той же нормально распределенной совокупности, то обе оценки дисперсии дают примерно одинаковые результаты
Слайд 23

Оценка по выборочным дисперсиям: Оценка по выборочным средним

Оценка по выборочным дисперсиям:
Оценка по выборочным средним

Слайд 24

Если рассчитанное значение F будет больше, чем табличное для соответствующего числа

Если рассчитанное значение F будет больше, чем табличное для соответствующего числа

степеней свободы и уровня значимости, то нулевая гипотеза о равенстве выборочных средних отвергается – различия будут статистически значимыми.
Слайд 25

Этапы дисперсионного анализа Проверка нормальности в каждой из групп Проверка гипотезы

Этапы дисперсионного анализа

Проверка нормальности в каждой из групп
Проверка гипотезы о равенстве

дисперсий
(тест Левена)
Если условия 1-2 не выполняются, следует применить непараметрический аналог дисперсионного анализа!
Собственно анализ вариаций
Апостериорное сравнение групп с помощью специальных процедур
Слайд 26

Примеры 1. Женщины с остеопорозом были распределены случайным образом по трем

Примеры

1. Женщины с остеопорозом были распределены случайным образом по трем группам:


лечение по стандартной методике,
лечение по новой методике
плацебо (контрольная группа).
Исследуемой переменной является изменение минеральной плотности
костной ткани, по которому различаются группы. Результаты можно
проанализировать с помощью однофакторного дисперсионного анализа.
2. В условиях предыдущего примера добавляем в качестве второй
группирующей переменной возраст. Возраст классифицируется как одна
из четырех порядковых категорий: от 30 до 40 лет, от 41 до 50, от 51 до
60, от 61 года и старше. Данные можно проанализировать с помощью
двухфакторного дисперсионного анализа
3. В условиях предыдущего примера добавление новых категориальных
переменных, таких как диета (вегетарианская или невегетарианская) и
употребление алкоголя (менее 60 мл алкоголя в день, от 60 до 150 мл в
день, более 150 мл в день), может превратить двухфакторный анализ в
четырехфакторный или многофакторный дисперсионный
анализ.
Слайд 27

Диета из рассмотренного примера не влияет на сердечный выброс

Диета из рассмотренного примера не влияет на сердечный выброс

Слайд 28

Обобщение метода на случай неравной численности групп Имеется k групп, ni

Обобщение метода на случай неравной численности групп

Имеется k групп, ni –

численность i-ой группы
Xi - среднее в i-ой группе
si2 – дисперсия в i-ой группе
- общий объем исследования
Слайд 29

Слайд 30

Курение считают основным фактором, предрасполагающим к хроническим обструктивным заболеваниям легких. Является

Курение считают основным фактором, предрасполагающим к хроническим обструктивным заболеваниям легких. Является

ли таким фактором пассивное курение?
Для проверки данного предположения изучалась проходимость дыхательных путей у некурящих, активных и пассивных курильщиков. Измерялась максимальная объемная скорость середины вдоха (л/с) у некурящих, активных и пассивных курильщиков. Ее уменьшение свидетельствует о нарушении проходимости дыхательных путей.
Можно ли считать этот показатель одинаковым во всех группах? (Выборки считать извлеченными из нормально распределенной совокупности)
Слайд 31

Количество групп k=5, общая численность исследования N=1000 человек.

Количество групп k=5, общая численность исследования N=1000 человек.

Слайд 32

Слайд 33

Слайд 34

Рассчитанное значение (64,1) больше табличного (3,41 для уровня 0,01). Можем опровергнуть

Рассчитанное значение (64,1) больше табличного (3,41 для уровня 0,01).
Можем опровергнуть нулевую

гипотезу с уровнем значимости 0,01 и утверждать, что максимальная объемная скорость середины вдоха в группах статистически значимо различается (вероятность ошибки менее 1%)
Слайд 35

Критерий Стьюдента с точки зрения дисперсионного анализа Критерий Стьюдента является вариантом

Критерий Стьюдента с точки зрения дисперсионного анализа

Критерий Стьюдента является вариантом дисперсионного

анализа в случае сравнения двух групп, при этом выполняется равенство F=t2 .
Межгрупповое число степеней свободы будет равно νмеж=k–1=2–1=1;
внутригрупповое νвнутр=k(n–1)=2(n–1)
Слайд 36

Средняя продолжительность госпитализации 36 больных пиелонефритом, получавших правильное (соответствующее официальным рекомендациям)

Средняя продолжительность госпитализации 36 больных пиелонефритом, получавших правильное (соответствующее официальным рекомендациям)

лечение, составила 4,51 суток, а у 36 больных, получавших неправильное лечение – 6,28 суток. Стандартные отклонения для этих групп составили соответственно 1,98 суток и 2,54 суток. Можно ли считать эти различия случайными?

Число степеней свободы ν = 2(n–1) = 2 (36 – 1)= 70. Для α = 0,01 и ν=70 tкрит=2,648 . Следовательно, различия в сроках госпитализации статистически значимы. Вероятность ошибки данного заключения составляет менее 1%.

Слайд 37

Слайд 38

Дисперсионный анализ повторных измерений В дисперсионном анализе повторных измерений одна и

Дисперсионный анализ повторных измерений
В дисперсионном анализе повторных измерений одна и та

же группа последовательно подвергается действию изучаемого фактора или просто наблюдается в несколько последовательных моментов времени.