Проверка статистических гипотез (лекция 2)

Содержание

Слайд 2

Статистическими гипотезами называются различного рода предположения о распределениях случайных величин, которые

Статистическими гипотезами называются различного рода предположения о распределениях случайных величин, которые

необходимо проверить по данным выборочной совокупности.

Рис. 1. Виды статистических гипотез

Статистические гипотезы

По количеству случайных величин

По направлению

По содержанию

Простые

Сложные

Направленные

Ненаправлен
ные

Нулевая

Альтернативная

Слайд 3

Простая гипотеза полностью задает одно распределение вероятностей. Например, между юношами и

Простая гипотеза полностью задает одно распределение вероятностей. Например, между юношами и

девушками существуют различия в значимости ценности «счастливая семейная жизнь».
Сложная гипотеза указывает не одно распределение, а некоторое множество распределений. Например, между юношами и девушками существуют различия в системе ценностных ориентаций личности.

Ненаправленные гипотезы утверждают, что показатели различны, но при этом не говорится о том, какой показатель больше другого.
Направленные гипотезы не только говорят о наличии или отсутствии различий, но и указывают направление этих различий.

В психологии, как правило, под нулевой гипотезой понимается гипотеза об отсутствии значимых различий между какими-либо показателями или о случайности связи между ними. Нулевая гипотеза обозначается как Н0. Альтернативная гипотеза – это гипотеза о наличии значимых различий между какими-либо показателями или о достоверности связи между ними. Она обозначается как Н1 .

Слайд 4

При проверке статистической гипотезы начинают с предположения о том, что нулевая

При проверке статистической гипотезы начинают с предположения о том, что нулевая

гипотеза верна.
Критерием проверки гипотезы называется некоторая функция выборки (Х1 , Х2 ,…, Хn), характеризующая степень соответствия выборочных данных статистической гипотезе.
Область значений критерия (R) разбивают на два подмножества: область принятия гипотезы [R`,R``] и критическую область. При попадании значения критерия R, подсчитанного по выборке, в область принятия, гипотеза принимается, в противном случае – отклоняется, принимается альтернативная.

Рис. 2. Область принятия гипотезы и критическая область

Слайд 5

При проверке статистических гипотез возможны ошибочные заключения двух типов. Ошибкой первого

При проверке статистических гипотез возможны ошибочные заключения двух типов.
Ошибкой первого рода

называется отклонение верной гипотезы в случае, когда она на самом деле верна.
Ошибка второго рода заключается в принятии неверной гипотезы, если она на самом деле неверна.

Уровень значимости результата исследования – это количественно выраженная вероятность, что полученные результаты достоверны.
Существует обратная зависимость между уровнем значимости и надежностью результата исследования. Чем выше р-уровень, тем ниже надежность и ниже уровень доверия к полученным результатам. Соотношение показателей р-уровня и степени значимости в таблице 1 (по А.Д. Наследову).
Таблица 1
Соотношение значимости и р-уровня

Слайд 6

Для проверки статистической гипотезы необходимо выполнить следующие этапы. Определить нулевую и

Для проверки статистической гипотезы необходимо выполнить следующие этапы.
Определить нулевую и альтернативную

гипотезы.
Задать уровень значимости р (допустимую вероятность ошибки первого рода).
Выбрать критерий проверки.
Определить критическую область.
По результатам эмпирического или экспериментального исследования вычислить фактическое значение критерия.
Если наблюдаемое значение критерия принадлежит критической области, то отклонить гипотезу, иначе – принять.
Слайд 7

Классификация статистических критериев в зависимости от исследовательских задач

Классификация статистических критериев в зависимости от исследовательских задач

Слайд 8

Возможности и ограничения параметрических и непараметрических критериев

Возможности и ограничения параметрических и непараметрических критериев

Слайд 9

Классификация статистических критериев

Классификация статистических критериев

Слайд 10

ОЦЕНКА ДОСТОВЕРНОСТИ РАЗЛИЧИЙ Решение о выборе того или иного критерия принимается

ОЦЕНКА ДОСТОВЕРНОСТИ РАЗЛИЧИЙ

Решение о выборе того или иного критерия принимается на

основе выполнения ряда требований
В зависимости от того, в какой шкале измеряются переменные и какое они имеют распределение, выбирают параметрические или непараметрические критерии.
Необходимо определить, сколько выборок сопоставляется.
Критерии оценки достоверности различий
Параметрические критерии
Если 2 выборки,
то критерий Стьюдента для независимых выборок
Если 3 выборки и более, то однофакторный дисперсионный анализ для независимых выборок
Непараметрические критерии
Если 2 выборки,
то критерий Манна-Уитни
Если 3 и более выборок,
то критерий Краскела-Уоллеса
Слайд 11

Критерий Стьюдента для независимых выборок Область применения: критерий предназначен для оценки

Критерий Стьюдента для независимых выборок
Область применения: критерий предназначен для оценки достоверности

различий между двумя независимыми группами на основе сравнения средних значений переменной.
Требования:
одна независимая (группирующая) переменная, измеренная в номинальной шкале и одна зависимая переменная, измеренная в метрических шкалах;
распределение зависимой переменной не должно значимо отличаться от нормального распределения.
Алгоритм расчета критерия.
Сформулировать нулевую (H0) и альтернативную гипотезы (H1).
Проверить нормальность распределения зависимой переменной.
Если tэмп ≥ tкр при р≤0,05, то отвергается H0 и принимается H1. Если tэмп < tкр при р≤0,1, то принимается H0 и отвергается H1.
Слайд 12

Однофакторный дисперсионный анализ для независимых выборок Область применения: критерий предназначен для

Однофакторный дисперсионный анализ для независимых выборок
Область применения: критерий предназначен для оценки

достоверности различий между тремя и более независимыми группами на основе сопоставления компонентов дисперсии изучаемой переменной.
Требования:
одна независимая переменная (фактор), измеренная в номинальной шкале и одна зависимая переменная, измеренная в метрических шкалах;
не менее трех уровней фактора и не менее двух испытуемых в каждой группе;
распределение зависимой переменной не должно значимо отличаться от нормального распределения;
гомогенность (равенство) дисперсий в сравниваемых группах, которое достигается за счет выравнивания количества испытуемых в каждом уровне фактора.
Алгоритм расчета критерия.
Сформулировать нулевую (H0) и альтернативную (H1) гипотезы.
Проверить нормальность распределения зависимой переменной.
Сопоставить эмпирическое и критическое значения : при Fэмп ≥ Fкр отклоняется H0 и принимается H1, при Fэмп < Fкр принимается H0 и отклоняется H1
Слайд 13

Критерий Манна-Уитни. Область применения: критерий предназначен для оценки достоверности различий между

Критерий Манна-Уитни.
Область применения: критерий предназначен для оценки достоверности различий между двумя

выборками, если данные представлены в порядковой шкале или в метрических шкалах, но не укладываются в кривую нормального распределения.
Требования:
одна независимая (группирующая) переменная, измеренная в номинальной шкале и одна зависимая переменная, измеренная в порядковой шкале или метрической шкале, но распределение значимо отличается от нормального;
в каждой выборке должно быть не менее трех и не более 60 наблюдений.
Алгоритм расчета критерия.
Сформулировать нулевую (H0) и альтернативную (H1) гипотезы.
Сопоставить эмпирическое и критическое значения: если Uэмп > Uкр при р = 0,05 ,то принимается H0 и отклоняется H1, если же Uэмп ≤ Uкр при р = 0,05, то отклоняется H0 и принимается H1.
Замечание. Критерий Манна-Уитни отличается от большинства других критериев тем, что для опровержения нулевой гипотезы эмпирическое значение должно быть меньше или равно критическому. При этом, чем меньше значение U, тем достоверность различий выше.
Слайд 14

Критерий Краскела – Уоллеса Область применения: критерий предназначен для оценки достоверности

Критерий Краскела – Уоллеса
Область применения: критерий предназначен для оценки достоверности различий

между тремя и более выборками по какому-либо показателю. Иногда H - критерий Краскела – Уоллеса рассматривается как непараметрический аналог метода однофакторного дисперсионного анализа для независимых выборок.
Требования:
одна независимая (группирующая) переменная, измеренная в номинальной или порядковой шкале и одна зависимая переменная, измеренная в порядковой шкале или метрической шкале, но распределение значимо отличается от нормального;
не менее трех уровней независимой (группирующей) переменной;
в каждой из выборок должно быть не менее трех наблюдений.
Алгоритм расчета критерия.
Сформулировать нулевую (H0) и альтернативную (H1) гипотезы.

Сопоставить эмпирическое и критическое значения:
при Hэмп ≥ Hкр отклоняется H0 и принимается H1, при Hэмп < Hкр принимается H0 и отклоняется H1.

Слайд 15

ОЦЕНКА ДОСТОВЕРНОСТИ СДВИГА с д в и г Временной Ситуационный Умозрительный

ОЦЕНКА ДОСТОВЕРНОСТИ СДВИГА

с д в и г
Временной
Ситуационный
Умозрительный
Структурный
Под влиянием контролируемых факторов

Временной сдвиг

определяется при сопоставлении показателей, полученных у одних и тех же испытуемых по одним и тем же методикам, но в разное время
Ситуационный сдвиг – это сопоставление показателей, полученных по одним и тем же методикам, но в разных условиях измерения.
Умозрительный сдвиг – это сопоставление показателей, измеренных в обычных и воображаемых условиях.
Структурный сдвиг – это сопоставление между собой разных показателей одних и тех же испытуемых, если они измерены в одних и тех же единицах, по одной и той же шкале.
Сдвиг под влиянием контролируемых факторов – это сопоставление замеров, произведенных до и после экспериментального воздействия, в специально созданных экспериментальных условиях.
Слайд 16

Критерии оценки достоверности сдвига Параметрические критерии Если 2 выборки, то критерий

Критерии оценки достоверности сдвига

Параметрические критерии
Если 2 выборки, то критерий Стьюдента для

зависимых выборок
Если 3 выборки и более, то однофакторный дисперсионный анализ для зависимых выборок
Непараметрические критерии
Если 2 выборки, то критерий Вилкоксона
Если 3 выборки и более, то критерий Фридмана
Слайд 17

Критерий Стьюдента для зависимых выборок Область применения: критерий предназначен для оценки

Критерий Стьюдента для зависимых выборок
Область применения: критерий предназначен для оценки достоверности

сдвига значений в двух зависимых выборках.
Требования:
две переменные, измеренные в метрических шкалах, на одной и той же группе испытуемых;
распределение переменных не должно значимо отличаться от нормального распределения.
Алгоритм расчета критерия.
Сформулировать нулевую (H0) и альтернативную гипотезы (H1).
Проверить нормальность распределения переменных.
Осуществить сравнение эмпирического и критического значений t. Если tэмп ≥ tкр при р≤0,05, то отвергается H0 и принимается H1. Если tэмп < tкр при р≤0,1, то принимается H0 и отвергается H1
Слайд 18

Однофакторный дисперсионный анализ для зависимых выборок Область применения: критерий предназначен для

Однофакторный дисперсионный анализ для зависимых выборок
Область применения: критерий предназначен для оценки

сдвига показателей в трех и более условиях на одной и той же выборке испытуемых.
Требования:
не менее трех условий фактора и не менее двух испытуемых, подвергшихся воздействию каждого условия;
переменные должны измеряться в метрических шкалах и иметь нормальное распределение в исследуемой выборке;
в каждом условии фактора должно соблюдаться равенство (гомогенность) дисперсий, которое достигается за счет выравнивания количества испытуемых в каждом условие фактора.
Алгоритм расчета критерия.
Сформулировать два набора гипотез.
Представить полученные данные в виде столбцов, каждый из которых соответствует тому или иному условию.
Проверить нормальность распределения переменных.
Сопоставить эмпирическое и критическое значения : при Fэмп ≥ Fкр отклоняется H0 и принимается H1, при Fэмп < Fкр принимается H0 и отклоняется H1
Слайд 19

Критерий Вилкоксона Область применения: критерий предназначен для оценки достоверности сдвига значений

Критерий Вилкоксона
Область применения: критерий предназначен для оценки достоверности сдвига значений в

зависимых выборках, если данные представлены в порядковой шкале или в метрических шкалах, но не укладываются в кривую нормального распределения.
Требования:
две переменные, измеренные в порядковой шкале или в метрических шкалах, распределение которых значимо отличается от нормального, на одной и той же группе испытуемых;
минимальное количество испытуемых, прошедших измерения в двух условиях не менее 5 человек.
Алгоритм расчета критерия.
Сформулировать нулевую (H0) и альтернативную (H1) гипотезы, предварительно не предсказывая направление различий.
Сопоставить эмпирическое и критическое значения: если Тэмп ≤ Ткр при р = 0,05 ,то отклоняется H0 и принимается H1, если же Тэмп > Ткр при р = 0,05, то принимается H0 и отклоняется H1.
Замечание. Критерий Вилкоксона отличается от большинства других критериев тем, что для опровержения нулевой гипотезы эмпирическое значение должно быть меньше или равно критическому. Следует дополнительно добавить, что этот критерий может быть односторонним (если направление сдвигов предсказывается) и двусторонним (если мы не предсказываем направление сдвигов). Уровни значимости для одностороннего и двустороннего критериев различны.