Основы практической био-медицинской статистики. t-критерий Стьюдента. Условия применимости. Интерпретация результатов

Содержание

Слайд 2

http://www.ats.ucla.edu/stat/sas/whatstat/default.htm

http://www.ats.ucla.edu/stat/sas/whatstat/default.htm

Слайд 3

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (ДА, ОПЯТЬ!) Нормальное распределение Среднее Стандартное отклонение

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (ДА, ОПЯТЬ!)

Нормальное распределение

Среднее

Стандартное отклонение

Слайд 4

Стандартизованное Z-значение Ответ на вопрос «как далеко от среднего находится данное

Стандартизованное Z-значение

Ответ на вопрос «как далеко от среднего находится данное значение»,

выраженный в относительных (стандартизованных) единицах;
Зная μ и σ, каждое значение х может быть преобразовано в значение z, и на основании таблиц площади под стандартизованной нормальной кривой;
В результате возможно ответить на вопрос «какова вероятность наблюдать подобное (или меньшее) значение x в совокупности с данными характеристиками (μ и σ).
Слайд 5

Слайд 6

Тестирование гипотез - пример

Тестирование гипотез - пример

 

Слайд 7

Тестирование статистических гипотез (прод.) Случайная простая выборка из 10 человек сделана

Тестирование статистических гипотез (прод.)

Случайная простая выборка из 10 человек сделана из

некоторой популяции. Средний возраст в выборке равен 27. Можем ли мы сделать заключение, что средний возраст популяции не равен 30? Дисперсия известна и равна 20. Пусть α=0.05
Слайд 8

Тестирование статистических гипотез (прод.)

Тестирование статистических гипотез (прод.)

 

Слайд 9

Тестирование статистических гипотез (прод.) Решение (прод.): Статистика теста: Распределение статистики теста:

Тестирование статистических гипотез (прод.)

Решение (прод.):
Статистика теста:
Распределение статистики теста: если предположения

верны и H0 верна, статистика теста следует нормальному распределению
Критерии принятия решения:
Отвергнуть H0, если рассчитанное z попадает в область неприятия гипотезы
Невозможность отвергнуть H0, если рассчитанное z попадает в область приятия гипотезы
Слайд 10

Тестирование статистических гипотез (прод.) В силу структуры H0 данный тест относится

Тестирование статистических гипотез (прод.)
В силу структуры H0 данный тест относится к

двусторонним. Т.о. H0 будет отвергнута в обоих случаях: если z ≤ -1.96 или z ≥ 1.96
Результат: H0 отвергнута для уровня значимости α=0.05. Заключение: μ≠30, р=0.034
Слайд 11

Доверительный интервал для среднего Когда мы приводим 1-α процентный доверительный интервал

Доверительный интервал для среднего

Когда мы приводим 1-α процентный доверительный интервал для

среднего, мы утверждаем, что вероятность того, что истинное среднее находится в этом интервале равна 1-α.
Т.е. если мы возьмем из совокупности ВСЕ выборки и для каждой рассчитаем доверительный интервал, то истинное среднее будет содержаться в 1-α интервалов.

СТАТИСТИЧЕСКИЙ ТЕСТ НАОБОРОТ!

Слайд 12

http://www.ats.ucla.edu/stat/sas/whatstat/default.htm

http://www.ats.ucla.edu/stat/sas/whatstat/default.htm

Слайд 13

t-критерий Стьюдента: анализ одной зависимой количественной переменной обладающей нормальным распределением; одна

t-критерий Стьюдента:
анализ одной зависимой количественной переменной обладающей нормальным распределением;
одна независимая категориальная

переменная из двух уровней (бинарная);
равенство дисперсий

Нормальное распределение

Среднее

Стандартное отклонение

Слайд 14

t-критерий Стьюдента для несвязанных совокупностей: Исследовалась длительность госпитализации пациентов с острым

t-критерий Стьюдента для несвязанных совокупностей:

Исследовалась длительность госпитализации пациентов с острым пиелонефритом

в группах «правильного» и «неправильного» лечения. «Правильным» считалось лечение в соответствии с «Настольным справочником врача».
Средняя длительность госпитализации составила:
В группе леченных «правильно» 4,51+/-1,98 сут.
В группе леченных «неправильно» 6,28+/-2,54 сут.
Можно ли считать эти различия случайными?
Слайд 15

t-критерий Стьюдента: Пример приведен из: С.Гланц. Медико-биологическая статистика. – М.Практика, 1998

t-критерий Стьюдента:

Пример приведен из: С.Гланц. Медико-биологическая статистика. – М.Практика, 1998

Слайд 16

Статистика t-критерия:

Статистика t-критерия:

 

Слайд 17

Слайд 18

Предположения (ограничения) для t-теста для независимых совокупностей Выборки сделаны случайным образом

Предположения (ограничения) для t-теста для независимых совокупностей

Выборки сделаны случайным образом (или,

как минимум, являются репрезентативными) из соответствующих популяций
Выборки не связаны между собой (если субъекты попарно подобраны, или это измерения по типу «до-после», должен быть использован парный критерий
Наблюдения внутри каждой выборки были получены независимо друг от друга (выбор одного не изменяет вероятность попасть в группу для других)
Данные получены из выборки с (приблизительно) нормальным распределением. Для больших выборок это не столь важное требование
SD двух популяций должна быть равны (иначе использовать модифицированный t-тест)
Гомоскедастичность
Слайд 19

http://www.ats.ucla.edu/stat/sas/whatstat/default.htm

http://www.ats.ucla.edu/stat/sas/whatstat/default.htm

Слайд 20

Анализ для связанных совокупностей: Анализ показателя у каждого пациента до и

Анализ для связанных совокупностей:

Анализ показателя у каждого пациента до и после

вмешательства
Набор пациентов попарно, с учетом таких показателей, как возраст, диагноз, пол и т.п.
Измерение показателя у близнецов или у пар родитель/ребенок
В целом – при любой ситуации, когда есть основания думать, что значение показателя конкретного субъекта из группы А «ближе» к значениям показателя другого (а не случайно выбранного) субъекта из группы В
Слайд 21

Предположения (ограничения) для парного t-теста: Пары должны быть случайным образом отобраны

Предположения (ограничения) для парного t-теста:

Пары должны быть случайным образом отобраны из

популяции большего размера (или, как минимум, быть репрезентативны по отношению к ней)
Наблюдения должны быть попарно сгруппированы, это делается при планировании эксперимента, и нельзя делать после получения данных
Каждая пара должна быть отобрана независимо от других пар
Распределение разности между парными значениями в популяции должно аппроксимироваться нормальным распределением
Слайд 22

Парный t-критерий Стьюдента Стандартное отклонение изменений признака: Чувствительность выше!

Парный t-критерий Стьюдента

Стандартное отклонение изменений признака:

Чувствительность выше!

Слайд 23

Слайд 24

Дисперсионный анализ (one-way ANOVA):

Дисперсионный анализ (one-way ANOVA):

 

Слайд 25

Дисперсионный анализ (one-way ANOVA): Исследовалась длительность госпитализации пациентов с острым пиелонефритом

Дисперсионный анализ (one-way ANOVA):

Исследовалась длительность госпитализации пациентов с острым пиелонефритом в

группах «правильного» и «неправильного» лечения. «Правильным» считалось лечение в соответствии с «Настольным справочником врача».
Средняя длительность госпитализации составила:
В группе леченных «правильно» 4,51+/-1,98 сут.
В группе леченных «неправильно» 6,28+/-2,54 сут.
Можно ли считать эти различия случайными?
Слайд 26

Дисперсионный анализ (one-way ANOVA): Пример приведен из: С.Гланц. Медико-биологическая статистика. – М.Практика, 1998

Дисперсионный анализ (one-way ANOVA):

Пример приведен из: С.Гланц. Медико-биологическая статистика. – М.Практика,

1998
Слайд 27

Дисперсионный анализ – анализ выборок по разности дисперсий для n уровней

Дисперсионный анализ – анализ выборок по разности дисперсий для n уровней

фактора!

S2вну= (S21+ S22+…+ S2n)/n

νмеж = m – 1

νвну = m (n – 1),
где m – число групп,
n – число случаев
в каждой группе
(меньшее)

Далее – попарные сравнения!

Слайд 28

P

P<0,01

Слайд 29

Длительность госпитализации: итоги Леченные правильно находились в больнице меньше чем, леченные

Длительность госпитализации: итоги

Леченные правильно находились в больнице меньше чем, леченные неправильно

и различия эти статистически значимы.
Значит ли это, что благодаря правильному лечению больные выздоравливают быстрее?

Увы, нет. Как это всегда бывает в обсервационном исследовании, мы не можем исключить того, что группы различались чем-то еще кроме лечения. Может быть, врачи, которые лечат «по справочнику» просто более склонны быстрее выписывать своих больных?

Слайд 30

Требования для дисперсионного анализа: Наблюдения независимо отобраны из большей популяции или

Требования для дисперсионного анализа:

Наблюдения независимо отобраны из большей популяции или (как

минимум) репрезентативны по отношению к ней
Выборки получены независимо (если субъекты отобраны попарно, или наблюдения носят характер «до-после», необходимо использовать ANOVA с повторными измерениями
Наблюдения внутри каждой выборки получены независимо друг от друга, связи между наблюдениями в группе должны быть равны (2 пациента измеренные 2 раза ≠ 4 измерениям)
Данные получены из выборки с распределением показателя, близким к нормальному, SD для всех популяций должны быть идентичны
Слайд 31

Слайд 32

Слайд 33

Слайд 34

Слайд 35

Слайд 36

Слайд 37

Слайд 38

Слайд 39

Слайд 40