Методы сравнений статистических совокупностей

Содержание

Слайд 2

Основные этапы статистического анализа Описание полученного массива данных Анализ данных и проверка различных гипотез

Основные этапы статистического анализа

Описание полученного массива данных
Анализ данных и проверка различных

гипотез
Слайд 3

Анализ данных и проверка различных гипотез 1. Сформулируйте вопрос, на который

Анализ данных и проверка различных гипотез

1. Сформулируйте вопрос, на который Вы

хотите ответить с помощью статистического анализа.
2. Выберите наиболее адекватный для ответа на данный вопрос статистический критерий или метод.
3. Правильно интерпретируйте его результаты.
Слайд 4

Некоторые направления статистического анализа Сравнение и определение достоверности различия Выявление и

Некоторые направления статистического анализа

Сравнение и определение достоверности различия
Выявление и измерение взаимосвязи

между признаками
Изучение динамики явления
Анализ выживаемости
Анализ прогностических факторов
Слайд 5

ВНИМАНИЕ ! При выборе статистического критерия или метода обратите внимание на условия их применения

ВНИМАНИЕ !

При выборе статистического критерия или метода обратите внимание на условия

их применения
Слайд 6

Сравнение и определение достоверности различия независимые группы опыт-контроль сопряженные группы «до»

Сравнение и определение достоверности различия

независимые группы

опыт-контроль

сопряженные группы

«до» и «после»

Две группы

параметрические

непараметрические

Несколько

групп
Слайд 7

Статистические методы сравнения совокупностей включают в себя следующие методы Оценка достоверности

Статистические методы сравнения совокупностей включают в себя следующие методы
Оценка достоверности

различия обобщающих коэффициентов (параметрические и непараметрические);
Оценка достоверности различий в распределении совокупностей ;
Стандартизация обобщающих коэффициентов.
Слайд 8

Общие принципы сравнения совокупностей основываются на анализе так называемой нулевой гипотезы (Но).

Общие принципы сравнения совокупностей основываются на анализе так называемой нулевой гипотезы

(Но).
Слайд 9

Согласно этой гипотезе первоначально принимается, что между совокупностями (показателями) различия случайны

Согласно этой гипотезе первоначально принимается, что между совокупностями (показателями) различия случайны

(не достоверны) , т.е., что обе группы вместе составляют один и тот же однородный материал, одну совокупность.
Слайд 10

Статистический анализ должен привести или к отклонению Но-гипотезы, если доказана достоверность

Статистический анализ должен привести или к отклонению Но-гипотезы, если доказана достоверность

полученных различий,
или к ее сохранению, если достоверность различий не доказана, т.е. различия признаны случайными.
Слайд 11

Т.к. статистические различия всегда характеризуются определенным уровнем значимости, то принятие решения

Т.к. статистические различия всегда характеризуются определенным уровнем значимости, то принятие решения

по отбрасыванию или сохранению Но - гипотезы связано с оценкой уровня значимости.
Слайд 12

В медико-биологических исследованиях общепризнанным минимальным уровнем значимости является р=0.05,

В медико-биологических исследованиях общепризнанным минимальным уровнем значимости является р=0.05,

Слайд 13

-если при сравнении совокупностей полученный при исследовании уровень значимости меньше 0,05

-если при сравнении совокупностей полученный при исследовании уровень значимости меньше 0,05

(р < 0,05),
то Но-гипотеза отбрасывается и различия в совокупностях признаются достоверными, воспроизводящимися при повторных исследованиях с определенной вероятностью;
Слайд 14

-если при сравнении совокупностей полученный в исследовании уровень значимости больше 0,05

-если при сравнении совокупностей полученный в исследовании уровень значимости больше 0,05

(р > 0,05),
то Но- гипотеза признается верной
( т.е.подтвержденной), что свидетельствует об отсутствии достоверных различий между совокупностями.
Слайд 15

Это может быть связано как с реальным отсутствием различий, так и

Это может быть связано как с реальным отсутствием различий, так и

с недостаточным объемом выборки, который не позволяет проявиться основным закономерностям изучаемого явления.
Слайд 16

Параметрические методы оценки достоверности различий обобщающих коэффициентов

Параметрические методы оценки достоверности различий обобщающих коэффициентов

Слайд 17

Параметрические методы оценки требуют знания характера распределения (только для нормального распределения)

Параметрические методы оценки требуют знания характера распределения (только для нормального распределения)

изучаемого признака и
его параметров (средних величин, стандартного отклонения и др.).
Слайд 18

Уровень значимости в этих методах определяется с помощью расчета критерия t

Уровень значимости в этих методах определяется с помощью расчета критерия t

и сравнения его значения с табличным, который соответствует определенному уровню значимости:
Слайд 19

- если t ф > t 0,05, то р - если

-         если t ф > t 0,05, то р < 0,05

и Но - гипотеза отвергается;
-         если t ф < t 0,05, то р > 0,05 и Но- гипотеза принимается,
при этом t ф - фактический критерий, рассчитанный исследовании;
t 0,05 - табличное значение критерия t для р = 0.05.
Слайд 20

Методы расчета критерия «t»

Методы расчета критерия «t»

Слайд 21

1.При сопоставлении двух независимых серий наблюдений:

1.При сопоставлении двух независимых серий наблюдений:

Слайд 22

для частотных показателей:

для частотных показателей:

Слайд 23

для средних величин:

для средних величин:

Слайд 24

Для оценки достоверности полученного критерия «t» при числе наблюдений больше 30

Для оценки достоверности полученного критерия «t» при числе наблюдений больше 30

можно пользоваться следующей закономерностью:
если критерий t ≥ 2, то он достоверен, т.к. соответствует р ≥ 0,95 или р ≤ 0,05
если критерий t ≥ 3, то он достоверен с большей степенью достоверности, т.к. соответствует р ≥ 0,99 или р ≤ 0,01.
Слайд 25

Для числа наблюдений меньше 30 достоверность критерия t определяется по таблице

Для числа наблюдений меньше 30 достоверность критерия t определяется по таблице

Стьюдента.
Для определения табличного значения критерия t необходимое число степеней свободы рассчитывается по формуле: n1 = n 1 + n 2 - 2
где n 1- число наблюдений в одной совокупности
п 2- число наблюдений в другой совокупности.
Слайд 26

При оценке двух методов операции в двух группах больных (n1= 145;

При оценке двух методов операции в двух группах больных (n1= 145;

n2=147) в качестве критерия была взята средняя длительность послеоперационного периода. Необходимо оценить достоверность различия по этому критерию. (Предполагается нормальное распределение изучаемого признака.)
Средняя длительность послеоперационного периода в соответствующих группах больных: метода №1: 1=9 дней, m1=0,3 дн.
метода №2: 2=11 дней, m2=0,2 дн.
Слайд 27

Так как представлены результаты сравнения средних величин в двух независимых совокупностях,

Так как представлены результаты сравнения средних величин в двух независимых совокупностях,
и

распределение изучаемого признака предполагается нормальным,
то для оценки достоверности различия можно использовать соответствующий критерий t.
t = =5,0
Слайд 28

Так как n > 30 для оценки достоверности критерия t можно

Так как n > 30 для оценки достоверности критерия t можно

использовать следующую закономерность: t0,05 ≥ 2; t0,01 ≥ 3.
Вывод: Т.к. tфакт.(5,0) > t0,01 (3), следовательно различия в средней длительности послеоперационного периода достоверны (р < 0,01), и по этому показателю метод №1 достоверно лучше метода №2.
Слайд 29

Для оценки эффективности вакцинации против гриппа провели изучение заболеваемости среди привитых

Для оценки эффективности вакцинации против гриппа провели изучение заболеваемости среди привитых

и непривитых. Необходимо оценить достоверность различия между этими показателями.
Заболеваемость непривитых: Р1=13,2 ‰, m1=0,9 ‰
Заболеваемость привитых: Р2=10,6 ‰, m2=1,1 ‰
Слайд 30

Так как представлены результаты сравнения двух относительных величин в двух независимых

Так как представлены результаты сравнения двух относительных величин в двух независимых

совокупностях, то для оценки достоверности различия можно использовать соответствующий критерий t.
Слайд 31

Так как n1,2 > 30 для оценки достоверности критерия t можно

Так как n1,2 > 30 для оценки достоверности критерия t можно

использовать следующую закономерность: t0,05 ³ 2; t0,01 ³ 3.
Вывод: Т.к. tфакт.(1,8) < t0,05 (2), следовательно различия в уровнях заболеваемости гриппом среди привитых и непривитых статистически недостоверно, и нет оснований считать противогриппозную вакцину эффективной.
Слайд 32

Сравнение двух сопряженных совокупностей по "разностному методу".

Сравнение двух сопряженных совокупностей по "разностному методу".

Слайд 33

Для сравнения степени однородности статистических групп используется критерий Фишера..Его значение велико

Для сравнения степени однородности статистических групп используется критерий Фишера..Его значение велико

в ряде специальных разделов статистики, особенно в дисперсионном анализе.
За Но-гипотезу в этом случае принимается признание равенства дисперсий в сравниваемых совокупностях. Критерий Фишера рассчитывается по формуле:
Слайд 34

Непараметрические методы оценки достоверности различий обобщающих коэффициентов

Непараметрические методы оценки достоверности различий обобщающих коэффициентов

Слайд 35

Положительные стороны непараметрических методов: не требуют предварительного расчета параметров распределения (средних

Положительные стороны непараметрических методов:
не требуют предварительного расчета параметров распределения (средних величин,

стандартного отклонения и др.);
не требуют предварительного знания характера распределения;
позволяют сравнивать совокупности с номинальными и порядковыми признаками;
просты в применении.
Слайд 36

Отрицательные стороны непараметрических методов: дают менее точные результаты, чем параметрические методы;

Отрицательные стороны непараметрических методов:
      дают менее точные результаты, чем параметрические методы;
     

имеют существенные ограничения в применении по числу наблюдений.
Слайд 37

При сравнении сопряженных (взаимосвязанных) совокупностей критерий знаков (Z) критерий Вилкоксона (Т) критерий Манна-Уитни-модификация

При сравнении сопряженных (взаимосвязанных) совокупностей
критерий знаков (Z)
критерий Вилкоксона (Т)


критерий Манна-Уитни-модификация
Слайд 38

При сравнении независимых совокупностей критерий Манна-Уитни критерий Розенбаума (Q) критерий Уайта

При сравнении независимых совокупностей
критерий Манна-Уитни
критерий Розенбаума (Q)
критерий

Уайта (К или Т)
критерий Ван дер Вандена (X)
серийный критерий (S)
критерий Колмогорова - Смирнова (λ)
Слайд 39

При альтернативном распределении совокупностей точный метод Фишера для четырехпольных таблиц (Р)

При альтернативном распределении совокупностей
точный метод Фишера для четырехпольных таблиц (Р)


Слайд 40

Оценка достоверности различий по методу "хи-квадрат"(критерию соответствия, критерию Пирсона, коэффициенту согласия)

Оценка достоверности различий по методу "хи-квадрат"(критерию соответствия, критерию Пирсона, коэффициенту согласия)

Слайд 41

Область применения метода: определение достоверности различий в нескольких сравниваемых группах и

Область применения метода:
определение достоверности различий в нескольких сравниваемых группах и при

нескольких результатах с определенной степенью достоверности;
определение наличия связи между явлениями без измерения ее величины;
оценка идентичности (близости) распределений двух и более вариационных
Слайд 42

Преимущества метода: не зависит от формы распределения; может использоваться для сравнения

Преимущества метода:
не зависит от формы распределения;
может использоваться для сравнения

нескольких групп (признаков)
используется на абсолютных цифрах;
Слайд 43

Ограничения метода: величина полученного "хи -квадрата" зависит от перегруппировки материала. Если

Ограничения метода:
величина полученного "хи -квадрата" зависит от перегруппировки материала. Если группировки

не ярко выражены, результат не показателен;
действует лишь как суммарный показатель различия, не устанавливая отклонение каких именно групп друг от друга обусловило конечный результат,
группы должны быть как можно более однородны для предупреждения "погашения влияний";
ожидаемые числа" при расчете должны быть не менее 5;
не следует применять, если число наблюдений < 20
служит для оценки независимых совокупностей
Слайд 44

Суть метода заключается в том, что в сравниваемых группах предполагается отсутствие

Суть метода заключается в том, что в сравниваемых группах предполагается отсутствие

различий в распределении совокупностей (отсутствие связи между исследуемыми факторами), т.е. формулируется Но-гипотеза.
На основании этой гипотезы рассчитывается новое распределение признаков в совокупности по группам (расчет т.н. "ожидаемых чисел")
Слайд 45

"Ожидаемые числа" сопоставляют с фактическим. Если Но-гипотеза верна, то теоретические и

"Ожидаемые числа" сопоставляют с фактическим.
Если Но-гипотеза верна, то теоретические и

фактические числа должны совпасть, и рассчитанный "хи -квадрат" будет равен О,
либо отклонение теоретических чисел от фактических будет незначительно и полученный •хи-квадрат" не превысит своего критического значения.
Слайд 46

Чем больше теоретические числа, рассчитанные на основе Но-гипотезы, будут отличаться от

Чем больше теоретические числа, рассчитанные на основе Но-гипотезы, будут отличаться от

фактических,
тем более "хи -квадрат" будет отличаться от О,
тем с большей вероятностью можно отклонить Но-гипотезу и говорить о статистической достоверности имеющихся различий в сравниваемых совокупностях.
Слайд 47

Хи - квадрат" рассчитывается по формуле: где р - фактические данные;

Хи - квадрат" рассчитывается по формуле:

где
р - фактические данные;
р1-"ожидаемые",теоретические числа, рассчитанные

на основе Но- гипотезы.
Слайд 48

При альтернативном распределении применяется упрощенная формула, которая рассчитывается на основе таблицы взаимной сопряженности (четырехпольной таблицы ):

При альтернативном распределении применяется упрощенная формула, которая рассчитывается на основе

таблицы взаимной сопряженности (четырехпольной таблицы ):
Слайд 49

всего всего

всего

всего

Слайд 50

где р-частота встречаемости признака в одной ( pi) и другой (

где
р-частота встречаемости признака в одной
( pi) и другой ( р2

) группе; q-альтернативный р показатель;
п -число наблюдений;
a;b;c;d -абсолютные числа в клетках таблицы.
Слайд 51

Оценка достоверности результатов: 1. Рассчитаный по формуле "хи-квадрат" оценивается по таблице

Оценка достоверности результатов:
1. Рассчитаный по формуле "хи-квадрат" оценивается по таблице χ2: достоверности

различий подтверждается и Но-гипотезы отклоняется, если χ2 факт.> χ2 0,05 при числе степеней свободы ( f )• не более 30.
Расчет f проводится по формуле:
f= (с-1)( г-1),
где с-число групп по горизонтали ( без итоговых);
г-число граф по вертикали (без итоговых).