Статистические критерии различий. (Лекция 3)

Содержание

Слайд 2

Статистический критерий – это решающее правило, обеспечивающее принятие истинной и отклонение

Статистический критерий – это решающее правило, обеспечивающее принятие истинной и отклонение

ложной гипотезы с высокой вероятностью.
Статистический критерий подразумевает также метод расчета определенного числа - эмпирического значения критерия (Чэмп).
Слайд 3

Критерии имеют свою специфику и различаются между собой по различным основаниям:

Критерии имеют свою специфику и различаются между собой по различным основаниям:
Тип

измерительной шкалы.
Зависимость или независимость выборок.
Количество сравниваемых выборок.
Совпадение (несовпадение) объемов сравниваемых выборок.
Ограничения по объему охватываемой выборки.
Мощность (способность выявлять различия между выборками).
Слайд 4

Критерий различия называют параметрическим, если он основан на конкретном типе распределения


Критерий различия называют параметрическим, если он основан на конкретном типе распределения

генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.) в формуле расчета.
Слайд 5

Критерий различия называют непараметрическим, если он не базируется на предположении о


Критерий различия называют непараметрическим, если он не базируется на предположении о

типе распределения генеральной совокупности и не использует параметры этой совокупности.
По- другому: «критерий, свободный от распределения».
Эти критерии основаны на оперировании частотами и рангами.
Слайд 6

Параметрические критерии: 1) при нормальном распределении генеральной совокупности обладают большей мощностью

Параметрические критерии:

1) при нормальном распределении генеральной совокупности обладают большей мощностью по

сравнению с непараметрическими
(т.е. они способны с большей достоверностью отвергать нулевую гипотезу, если она неверна);
2) им следует отдавать предпочтение когда выборки взяты из нормально распределенных генеральных совокупностей.
Слайд 7

Понятие нормы в психологии многозначно. Норма понимается как норматив, т.е. как

Понятие нормы в психологии многозначно.
Норма понимается как норматив, т.е. как

эталон, на который необходимо равняться, оценивая по нему свое индивидуальное поведение (нормы питания, спортивные нормы и т.д.). Такие нормы (нормативы) являются условными и имеют значение только в определенной системе отсчета.
Норма также понимается как функциональный оптимум, подразумевающий протекание всех процессов в системе с наиболее возможной слаженностью, эффективностью и экономичностью.
Функциональная норма всегда индивидуальна, в ней лежит представление о неповторимости пути развития каждого человека, и ее нарушение определяется функциональны-ми последствиями.
Слайд 8

Третьей системой отсчета является норма, понимаемая как статистически среднее, наиболее часто

Третьей системой отсчета является норма, понимаемая как статистически среднее, наиболее часто

встречающееся, массовое в явлениях.
«Нормальное» в статистическом смысле включает не только среднестатистическую величину, но и серию отклонений от нее в известном диапазоне.
Слайд 9

Нормальный закон распределений лежит в основе измерений, разработки тестовых шкал и

Нормальный закон распределений лежит в основе измерений, разработки тестовых шкал и

методов проверки гипотез.
Нормальное распределение играет большую роль в математической статистике, так как многие статистические методы предполагают, что анализируемые данные распределены нормально.
Нормальное распределение часто встречается в природе. Нормальное распределение характеризует такие случайные величины, на которые воздействует большое количество разнообразных факторов (ошибки, возникаю-щие при измерениях, отклонения при стрельбе).
Слайд 10

Например, если у испытуемых, выбранных случайным образом, измерять их рост, вес,

Например, если у испытуемых, выбранных случайным образом, измерять их рост, вес,

интеллект, какие-либо свойства личности, а затем построить график частоты встречаемос-ти показателей любой из этих величин, то мы получим распределение, у которого крайние значения встречаются редко, а от крайних значений к середине частота повышается.
График нормального распределения имеет вид симметричной, колоколообразной кривой.
Слайд 11

Слайд 12

В психологических исследованиях нормальное распределение используется при разработке и применении тестов

В психологических исследованиях нормальное распределение используется при разработке и применении тестов

интеллекта.
Отклонения показателей интеллекта следуют закону нормального распределения.
Применительно к другим психологическим категориям и сферам (личностная, мотивацион-ная) применение закона нормального распределения является дискуссионным.
Слайд 13

Существует множество критериев проверки соответствия изучаемого распределения нормальному. Наиболее простой критерий:

Существует множество критериев проверки соответствия изучаемого распределения нормальному.
Наиболее простой критерий:

если мода, медиана и среднее арифметическое равны, то ряд имеет нормальное распределение.
Наиболее эффективным критерием при проверке нормальности распределения считается критерий Колмогорова-Смирнова.
Слайд 14

Преимущества непараметрических критериев: при оценке различий в распределениях, далеких от нормального,

Преимущества непараметрических критериев:

при оценке различий в распределениях, далеких от нормального, непараметрические

критерии могут выявить значимые различия, в то время как параметрические критерии таких различий не обнаружат;
непараметрические критерии выявляют значимые различия и в том случае, если распределение близко к нормальному;
при вычислениях вручную непараметрические критерии являются значительно менее трудоемкими, чем параметрические;
подавляющее большинство данных, получаемых в психологических экспериментах, не распределены нормально.
Слайд 15

Критерий включает в себя: формулу расчета эмпирического значения критерия (Чэмп) по

Критерий включает в себя:

формулу расчета эмпирического значения критерия (Чэмп) по выборочным

данным;
правило (формулу) определения числа степеней свободы;
теоретическое распределение для данного числа степеней свободы;
правило соотнесения эмпирического значения критерия с теоретическим распределением для определения вероятности того, что проверяемая гипотеза верна.
Слайд 16

Число степеней свободы – количество возможных направлений изменчивости признака. Нахождение числа

Число степеней свободы – количество возможных направлений изменчивости признака.
Нахождение числа степеней

свободы для каждого признака имеет свои специфические особенности.
Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций: чем больше эти показатели, тем больше число степеней свободы.
Каждая формула для расчета эмпирического значения критерия обязательно сопровождается правилом (формулой) для определения числа степеней свободы.
Слайд 17

Этапы подготовки исследования: 1. Определить, является ли выборка связной (зависимой) или

Этапы подготовки исследования:

1. Определить, является ли выборка связной (зависимой) или несвязной

(независимой).
2. Определить однородность–неоднородность выборки.
3. Оценить объем выборки и, зная ограничения каждого критерия по объему, выбрать соответствующий критерий.
4. Целесообразнее всего начинать работу с выбора наименее трудоемкого критерия.
5. Если используемый критерий не выявил различия – следует применить более мощный, но одновременно и более трудоемкий критерий.
Слайд 18

6. Если в распоряжении исследователя имеется несколько критериев, то следует выбирать

6. Если в распоряжении исследователя имеется несколько критериев, то следует выбирать

те из них, которые наиболее полно используют информацию, содержащуюся в экспериментальных данных.
7. При малом объеме выборки следует увеличивать величину уровня значимости (не менее 1%), так как небольшая выборка и низкий уровень значимости приводят к увеличению вероятности принятия ошибочных решений.
Слайд 19

Оценка достоверности сдвига: G-критерий знаков; парный Т-критерий Вилкоксона; критерий - Фридмана;

Оценка достоверности сдвига:

G-критерий знаков;
парный Т-критерий Вилкоксона;
критерий - Фридмана;
L- критерий Пейджа;
t-критерий Стьюдента

для зависимых выборок.
Слайд 20

Критерий знаков G Назначение критерия. Он предназначен для установления общего направления

Критерий знаков G

Назначение критерия.
Он предназначен для установления общего направления сдвига исследуемого

признака. Позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму.
Слайд 21

Пример. Будет ли тренинг способствовать повышению показателей по методике «Шкала социального интереса»?

Пример. Будет ли тренинг способствовать повышению показателей по методике «Шкала социального

интереса»?
Слайд 22

Результаты диагностики «до» и «после» воздействия:

Результаты диагностики «до» и «после» воздействия:

Слайд 23

Определим «сдвиг»,как разность между показателями каждого участника «после» и «до» тренинга: «после»- «до»

Определим «сдвиг»,как разность между показателями каждого участника «после» и «до» тренинга:

«после»- «до»
Слайд 24

Подсчитаем общее число нулевых, положительных и отрицательных сдвигов: общее число нулевых

Подсчитаем общее число нулевых, положительных и отрицательных сдвигов:
общее число нулевых сдвигов

– 1;
общее число положительных сдвигов – 9;
общее число отрицательных сдвигов – 0.
Слайд 25

Преобладающие сдвиги назовем типичными сдвигами; их количество обозначается буквой n. Сдвиги

Преобладающие сдвиги назовем типичными сдвигами; их количество обозначается буквой n.
Сдвиги более

редкого, противоположного направления – нетипичными сдвигами; их количество обозначается как Gэмп.
В нашем случае количество типичных сдвигов n = 9, а нетипичных сдвигов –
Gэмп = 0.
Слайд 26

Сформулируем статистические гипотезы: H0 – преобладание типичного направления сдвига является случайным.

Сформулируем статистические гипотезы:
H0 – преобладание типичного направления сдвига является случайным.
H1 -

преобладание типичного направления сдвига не является случайным.
Слайд 27

Оценка статистической достоверности сдвига по критерию G-знаков производится по таблице 1

Оценка статистической достоверности сдвига по критерию G-знаков производится по таблице 1

Приложения.
В нашем примере n = 9, поэтому наша часть таблицы выглядит следующим образом:
Слайд 28

Построим «ось значимости», на которой расположим критические значения G0,05 = 1,

Построим «ось значимости», на которой расположим критические значения
G0,05 = 1,

G0,01 = 0 и эмпирическое значение Gэмп = 0. (В G-критерии ось перевернута!)
G0,05 = 1 G0,01 = 0

Зона значимости

Зона незначимости

Зона
неопределенности

Слайд 29

Gэмп совпало с критическим значением зоны значимости G0,01 = 0. Выводы:

Gэмп совпало с критическим значением зоны значимости G0,01 = 0.
Выводы:
1.Гипотеза

H0 отклоняется и принимается гипотеза H1 о том, что сдвиг показателей после тренинга является не случайным.
2.Полученный в результате эксперимента сдвиг показателей статистически значим на уровне P = 0,01.
3. Тренинг способствовал увеличению показателей по методике «Шкала социального интереса» статистически достоверно.
Слайд 30

Условия применимости G-критерия: Измерение может быть проведено в шкале порядка, интервалов

Условия применимости G-критерия:

Измерение может быть проведено в шкале порядка, интервалов и

отношений.
Выборка должна быть однородной и связной.
Объем сравниваемых выборок должен быть одинаковым.
G-критерий знаков может применяться при величине типичного сдвига от 5 до 300.
G-критерий знаков достаточно эффективен при больших объемах выборок.
При равенстве количества типичных и нетипичных сдвигов критерий знаков неприменим.
Слайд 31

Парный критерий T-Вилкоксона Назначение критерия Критерий T-Вилкоксона применяется для оценки различий

Парный критерий T-Вилкоксона

Назначение критерия
Критерий T-Вилкоксона применяется для оценки различий экспериментальных данных,

полученных в двух разных условиях на одной и той же выборке испытуемых.
Он позволяет выявить не только направленность изменений, но и позволяет установить насколько сдвиг показателей в каком-то одном направлении является более интенсивным, чем в другом.
Слайд 32

Пример. Способствовала ли коррекционная работа снижению реактивной тревожности участников эксперимента?

Пример. Способствовала ли коррекционная работа снижению реактивной тревожности участников эксперимента?

Слайд 33

Показатели реактивной тревожности по методике Ч.Д. Спилбергера

Показатели реактивной тревожности по методике Ч.Д. Спилбергера

Слайд 34

Сформулируем статистические гипотезы: H0 – интенсивность сдвигов в типичном направлении не

Сформулируем статистические гипотезы:
H0 – интенсивность сдвигов в типичном направлении не превосходит

интенсивности сдвигов в нетипичном направлении .
H1 - интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении .
Слайд 35

Слайд 36

Сдвиг в более часто встречающемся направлении назовем типичным сдвигом. Сдвиг в противоположном направлении – нетипичным.

Сдвиг в более часто встречающемся направлении назовем типичным сдвигом.
Сдвиг в противоположном

направлении – нетипичным.
Слайд 37

Тэмп численно равно сумме рангов нетипичных сдвигов. В нашем случае нетипичных

Тэмп численно равно сумме рангов нетипичных сдвигов.
В нашем случае

нетипичных сдвигов два: +3 и +1. Их ранги равны 2 и 1 соответственно. Следовательно,
Тэмп = 2 + 1 = 3.
Слайд 38

Оценка статистической достоверности сдвига по Т-критерию производится по таблице 2 Приложения.

Оценка статистической достоверности сдвига по Т-критерию производится по таблице 2 Приложения.


Поиск критических величин по таблице ведется по числу испытуемых. В нашем примере n = 12, поэтому наша часть таблицы выглядит следующим образом
Слайд 39

Построим «ось значимости», на которой расположим критические значения Т0,05 = 17,

Построим «ось значимости», на которой расположим критические значения
Т0,05 = 17,

Т0,01 = 9 и эмпирическое значение Тэмп = 3. (В Т-критерии ось перевернута!)
Т0,05 = 17 Т0,01 = 9 Тэмп =3

Зона значимости

Зона незначимости

Зона
неопределенности

Слайд 40

Полученная величина Tэмп попала в зону значимости. Гипотеза H0 отклоняется и

Полученная величина Tэмп попала в зону значимости.
Гипотеза H0 отклоняется

и принимается гипотеза H1 о том, что сдвиг показателей после коррекционной работы является не случайным.
Полученный в результате эксперимента сдвиг показателей статистически значим на уровне p < 0,01.
Коррекционная работа способствовала снижению реактивной тревожности участников эксперимента статистически достоверно.
Слайд 41

Условия применимости критерия Т-Вилкоксона: Измерение может быть проведено во всех шкалах,

Условия применимости критерия Т-Вилкоксона:

Измерение может быть проведено во всех шкалах, кроме

номинальной.
Выборка должна быть связной.
Объем сравниваемых выборок должен быть одинаковым.
Критерий Т- Вилкоксона может применяться при численности выборки от 5 до 50.
Слайд 42

Оценка достоверности различий: Q- критерий Розенбаума; U- критерий Манна-Уитни; ϕ -критерий (угловое преобразование Фишера).

Оценка достоверности различий:

Q- критерий Розенбаума;
U- критерий Манна-Уитни;
ϕ -критерий (угловое преобразование Фишера).

Слайд 43

Критерий Q Розенбаума Назначение критерия Критерий используется для оценки различий между

Критерий Q Розенбаума

Назначение критерия
Критерий используется для оценки различий между двумя выборками

по уровню какого-либо признака, количественно измеренного.
В каждой из выборок должно быть не менее 11 испытуемых.
Слайд 44

Замечание. 1. Если критерий не выявляет достоверных различий, это еще не

Замечание.
1. Если критерий не выявляет достоверных различий, это еще не означает,

что их действительно нет.
2. Если же Q- критерий выявляет достоверные различия между выборками с уровнем значимости Р≥0.01, можно ограничиться только им и избежать трудностей применения других критериев.
Слайд 45

Критерий применяется в тех случаях, когда данные представлены, по крайней мере,

Критерий применяется в тех случаях, когда данные представлены, по крайней мере,

в порядковой шкале. Признак должен варьировать в каком-то диапазоне, иначе сопоставления с помощью Q-критерия просто невозможны.
Слайд 46

Применение критерия начинают с того, что упорядочивают значения признака в обеих

Применение критерия начинают с того, что упорядочивают значения признака в

обеих выборках по нарастанию (или убыванию) признака.
При этом рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом – тот, где значения ниже.
.
Слайд 47

Гипотезы: H0: Уровень признака в выборке 1 не превышает уровня признака

Гипотезы:
H0: Уровень признака в выборке 1 не превышает уровня признака в

выборке 2.
H1 : Уровень признака в выборке 1 превышает уровень признака в выборке 2.
Слайд 48

Условия использования критерия: Измерение может быть проведено в шкале порядка, интервалов

Условия использования критерия:


Измерение может быть проведено в шкале порядка, интервалов

и отношений.
Выборки должны быть независимыми.
В каждой из выборок должно быть не меньше 11 испытуемых.
Приведенная в пособии таблица ограничивает верхний предел выборки 26 испытуемыми.
При числе наблюдений n1, n2≥ 26 можно пользо-ваться следующими величинами :
Qкр1=8 если Р≤0,05 ; Qкр2=10 если Р≤0,01 .
Слайд 49

6. Принципиальным условием, дающим возможность применять критерий, является наличие «хвостов» в

6. Принципиальным условием, дающим возможность применять критерий, является наличие «хвостов» в

сравниваемых рядах .
Замечание. В случае расположения выборок следующим образом (один из двух рядов имеет два «хвоста»):
х х х х х х х х х х х х х х
у у у у у у у
критерий Q-Розенбаума неприменим!.
Слайд 50

Работа с критерием Розенбаума предполагает подсчет так называемых «хвостов». Потому этот

Работа с критерием Розенбаума предполагает подсчет так называемых «хвостов». Потому этот

критерий имеет также название — «критерий хвостов».
|t t t t| t t t t t t
z z z z |z z z z|
S1=6, S2=4
Qэмп= S1 +S2
Слайд 51

Алгоритм подсчета критерия Q Розенбаума: 1.Проверить, выполняются ли ограничения: n1, n2≥

Алгоритм подсчета критерия Q Розенбаума:


1.Проверить, выполняются ли ограничения: n1, n2≥ 11
n1≈

n2.
2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше (правее), а выборкой 2 – ту, где значения предположительно ниже (левее).
3. Определить самое высокое (максимальное) значение в выборке 2.
4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S1 .
Слайд 52

5. Определить самое низкое (минимальное) значение в выборке 1. 6. Подсчитать

5. Определить самое низкое (минимальное) значение в выборке 1.
6. Подсчитать количество

значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как S2 .
7. Посчитать по формуле: Qэмп= S1 +S2
8. По таблице 8 Приложения определить Qкр для данных n1 и n2 . Если Qэмп ≥Qкр 0,05 , то H0 - отвергается.
9. При n1, n2≥ 26 сопоставить полученное Qэмп c
Qкр1=8 если Р≤0,05 ;
Qкр2=10 если Р≤0,01 .
Если Qэмп превышает или, по крайней мере, равняется Qкр1=8 , то H0 - отвергается.
Слайд 53

Задача. Будут ли обнаружены статистически достоверные различия в показателях ситуативной тревожности

Задача. Будут ли обнаружены статистически достоверные различия в показателях ситуативной тревожности

между подростками с делинквентным (асоциальным, противо-правным) поведением и подростками без отклоняющегося поведения?
Слайд 54

Слайд 55

Упорядочим числа в порядке возрастания. Разместим два сравниваемых ряда таким образом,

Упорядочим числа в порядке возрастания.
Разместим два сравниваемых ряда таким образом, чтобы

равные элементы находились друг под другом
Слайд 56

Сформулируем статистические гипотезы: H0 – отсутствуют статистически достоверные различия между группами.

Сформулируем статистические гипотезы:
H0 – отсутствуют статистически достоверные различия между группами.


H1 – существуют статистически достоверные различия между группами.
Слайд 57

Подсчитаем правый (S1) и левый (S2) «хвосты». Величина S1 равна числу

Подсчитаем правый (S1) и левый (S2) «хвосты». Величина S1 равна числу

элементов первого ряда, которые находятся справа и не имеют совпадающих элементов второго ряда. Величина S2 – числу элементов второго ряда, находящихся слева и не имеющих совпадающих элементов первого ряда.
В нашем случае S1 = 1, а S2 = 3.
Qэмп= S1 +S2 =1+3=4
Слайд 58

Критические значения для критерия Q-Розенбаума находим по таблице 8 Приложения. Поиск

Критические значения для критерия Q-Розенбаума находим по таблице 8 Приложения.
Поиск

критических величин ведется по числу испытуемых n1=11, n2=11. Определяем что Q0,05 = 6; Q0,01 = 9.
Слайд 59

Построим «ось значимости», на которой расположим критические значения Q0,05 = 6,

Построим «ось значимости», на которой расположим критические значения
Q0,05 = 6,

Q0,01 = 9 и эмпирическое значение Qэмп = 4.
Qэмп = 4 Q0,05 = 6 Q0,01 = 9

Зона значимости

Зона незначимости

Зона
неопределенности

Слайд 60

Полученная величина Qэмп попала в зону незначимости. Принимается гипотеза H0 о

Полученная величина Qэмп попала в зону незначимости.
Принимается гипотеза H0

о том, что отсутствуют статистически достоверные различия между группами.
Статистически достоверные различия в показателях ситуативной тревожности между подростками с делинквентным поведением и подростками без отклоняющегося поведения не выявлены.
Слайд 61

Критерий U Вилкоксона-Манна-Уитни Назначение критерия Критерий предназначен для оценки различий между

Критерий U Вилкоксона-Манна-Уитни

Назначение критерия
Критерий предназначен для оценки различий между двумя выборками

по уровню какого-либо признака, количественно измеренного.
Он позволяет выявлять различие между малыми выборками, когда n1, n2≥ 3 или n1=2, n2≥ 5 и является более мощным, чем критерий Розенбаума.
Слайд 62

Гипотезы: H0: Уровень признака в группе 2 не ниже уровня признака

Гипотезы:
H0: Уровень признака в группе 2 не ниже уровня признака в

группе1.
H1 : Уровень признака в группе 2 ниже уровня признака в группе1.
(1-м рядом, выборкой, группой называется ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом – тот, где они предположительно ниже).
Слайд 63

Условия применимости U-критерия: Измерение должно быть проведено в шкале интервалов и

Условия применимости U-критерия:


Измерение должно быть проведено в шкале интервалов и

отношений.
Выборки должны быть независимыми.
Нижняя граница применимости критерия n1, n2≥ 3 или n1=2, n2≥ 5.
Верхняя граница применимости критерия: n1,n2≤60 .
Слайд 64

Алгоритм подсчета U-критерия : Исходные данные расположить в таблице в двух

Алгоритм подсчета U-критерия :

Исходные данные расположить в таблице в двух столбцах

в порядке возрастания (с пропусками). Количество строк в таблице n1+n2 .
Проранжировать данные двух столбцов как одного, записывая ранги чисел первого столбца в столбец R(X), а ранги 2-го столбца – в столбец R(Y).
По каждому столбцу в отдельности подсчитать суммы рангов.
Слайд 65

Проверить правильность ранжирования. Наибольшая по величине ранговая сумма обозначается как Rmax

Проверить правильность ранжирования.
Наибольшая по величине ранговая сумма обозначается как Rmax .
Определить

значение Uэмп по формуле:
где n1 - численное значение первой выборки,
n2 - численное значение второй выборки,
Rmax - наибольшая по величине сумма рангов,
nx- количество испытуемых в группе с большей суммой рангов.
Слайд 66

Определить критические значения Uкр 0,05 и Uкр 0,01 по таблице 7

Определить критические значения Uкр 0,05 и Uкр 0,01 по таблице 7

Приложения 1.
Построить «ось значимости», на которой расположить критические значения Uкр 0,05 , Uкр 0,01 и эмпирическое значение Uэмп .
(В U-критерии ось перевернута!)
U0,05 U0,01

Зона значимости

Зона незначимости

Зона
неопределенности

Слайд 67

Если Uэмп >Uкр 0,05 принимается гипотеза H0. Если Uэмп ≤Uкр 0,05

Если Uэмп >Uкр 0,05 принимается гипотеза H0. Если Uэмп ≤Uкр 0,05

, то Н0 отвергается.
Чем меньше Uэмп , тем достоверность различий выше.
Слайд 68

Задача:

Задача:

Слайд 69

Слайд 70

4. Проверим правильность ранжирования: 55,5+97,5=153 N=8+9=17. N·(N+1)/2=17·18/2=153 5. Наибольшая по величине

4. Проверим правильность ранжирования:
55,5+97,5=153
N=8+9=17. N·(N+1)/2=17·18/2=153
5. Наибольшая по величине ранговая сумма Rmax

=97,5
6. Определим значение Uэмп по формуле:
где n1 - численное значение первой выборки,
n2 - численное значение второй выборки,
Rmax - наибольшая по величине сумма рангов,
nx- количество испытуемых в группе с большей суммой рангов.
Слайд 71

Величины критических значений находим по таблице 7 Приложения. Строим «ось значимости»: Вычислим Uэмп .

Величины критических значений находим по таблице 7 Приложения.
Строим «ось значимости»:

Вычислим Uэмп

.
Слайд 72

Вывод: 1. Принимается гипотеза H0 о сходстве. H0: Уровень признака в

Вывод:

1. Принимается гипотеза H0 о сходстве.
H0: Уровень признака в группе 2

не ниже уровня признака в группе1.
2. Психолог может утверждать, что мотивация не приводит к статистически значимому увеличению времени решения технической задачи.
Слайд 73

Выявление различий в распределении признака:

Выявление различий в распределении признака:

Слайд 74

Критерий Пирсона (хи-квадрат ) - один из наиболее часто использующихся в

Критерий Пирсона (хи-квадрат )

- один из наиболее часто использующихся в

психологических исследованиях, поскольку он позволяет решать большое число разных задач, и, кроме того, исходные данные для него могут быть получены в любой шкале, начиная со шкалы наименований.
Слайд 75

Назначение критерия хи-квадрат Пирсона Критерий отвечает на вопрос о том, с

Назначение критерия хи-квадрат Пирсона

Критерий отвечает на вопрос о том, с одинаковой

ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.
Слайд 76

Критерий хи-квадрат используется в двух вариантах: для расчета согласия эмпирического распределения

Критерий хи-квадрат используется в двух вариантах:
для расчета согласия эмпирического распределения и

предполагаемого теоретического; в этом случае проверяется гипотеза об отсутствии различий между теоретическим и эмпирическим распределениями;
Слайд 77

для расчета однородности двух независимых экспериментальных выборок; в этом случае проверяется

для расчета однородности двух независимых экспериментальных выборок; в этом случае проверяется

гипотеза об отсутствии различий между двумя (тремя или более) эмпирическими (экспериментальными) распределениями одного и того же признака.
Слайд 78

Критерий построен так, что при полном совпадении двух экспериментальных распределений величина

Критерий построен так, что при полном совпадении двух экспериментальных распределений величина

,
и чем больше расхождение между сопоставляемыми распределениями, тем больше величина эмпирического значения хи-квадрат.
Слайд 79

Гипотезы: Первый вариант: H0: Полученное эмпирическое распределение признака не отличается от

Гипотезы:

Первый вариант:
H0: Полученное эмпирическое распределение признака не отличается от теоретического (например,

равномерного) распределения.
H1 : Полученное эмпирическое распределение признака отличается от теоретического распределения.
Второй вариант:
H0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.
H1 : Эмпирическое распределение 1 отличается от эмпирического распределения 2.
Слайд 80

Третий вариант: H0 : Эмпирические распределения 1, 2. 3. … не

Третий вариант:
H0 : Эмпирические распределения 1, 2. 3. … не различаются

между собой.
H1 : Эмпирические распределения 1, 2. 3. … различаются между собой
Слайд 81

Условия применимости критерия - Пирсона: 1. Измерение может быть проведено в

Условия применимости критерия - Пирсона:
1. Измерение может быть проведено в любой

шкале.
2. Выборки должны быть случайными и независимыми.
3. Желательно, чтобы объем выборки был ≥ 20. С увеличением объема выборки точность критерия повышается.
4. Теоретическая частота для каждого выборочного интервала не должна быть меньше 5.
5. Сумма наблюдений по всем интервалам должна быть равна общему количеству наблюдений.
6. Таблица критических значений критерия рассчитана для числа степеней свободы ν , которое каждый раз рассчитывается по определенным правилам;
Для таблиц число степеней свободы определяется по формуле:
ν=(k-1)(c-1) , где k - число строк, с - число столбцов.
Слайд 82

Сравнение двух эмпирических распределений Исходные данные двух эмпирических рас-пределений для сравнения

Сравнение двух эмпирических распределений

Исходные данные двух эмпирических рас-пределений для сравнения

между собой могут быть представлены разными способами.
Наиболее простой из этих способов: так называемая «четырехпольная таблица». Она используется в тех случаях, когда в первой выборке имеются два значения (числа) и во второй выборке также два значения (числа).
Слайд 83

Задача. Одинаков ли уровень подготовлен-ности учащихся в двух школах, если в

Задача. Одинаков ли уровень подготовлен-ности учащихся в двух школах, если в

первой школе из 100 человек поступили в вуз 82 человека и во второй школе из 87 человек поступили в вуз 44?
Решение. Условия задачи можно представить в виде четырехпольной таблицы ячейки которой, обозначаются обычно как А, В, С и D:
Слайд 84

Таблица 1

Таблица 1

Слайд 85

Величину подсчитаем по формуле: , где - эмпирическая частота, - теоретическая частота, k- количество разрядов признака.

Величину подсчитаем по формуле:
,
где - эмпирическая частота,
- теоретическая частота,

k- количество разрядов признака.
Слайд 86

Согласно данным, представленным в таблице, в нашем случае имеется четыре эмпирические

Согласно данным, представленным в таблице, в нашем случае имеется четыре эмпирические

частоты, это соответственно 82, 44, 18 и 43.
Для того чтобы можно было использовать формулу расчета, необходимо для каждой из этих эмпирических частот найти соответственные «теоретические» частоты.
Слайд 87

Из таблицы следует, что 18 и 43 человека из первой и

Из таблицы следует, что 18 и 43 человека из первой и

второй школ соответственно не поступили в вуз.
Относительно этих величин подсчитывается величина Р. Это так называемая доля признака, или частота.
В данном случае признаком явилось то, что выпускники не поступили в вуз.
Слайд 88

Величина Р подсчитывается по формуле Величина Р позволяет рассчитать «теоретические» частоты

Величина Р подсчитывается по формуле
Величина Р позволяет рассчитать «теоретические» частоты

для третьей строчки таблицы, которые обозначим как и .
Слайд 89

Эти частоты показывают, сколько учащихся из первой и второй школ не

Эти частоты показывают, сколько учащихся из первой и второй школ не

должны были поступить в вуз. Они подсчитывается следующим образом:
для первой школы
для второй школы
Слайд 90

Произведем расчет того, сколько учащихся должны были бы поступить в вуз

Произведем расчет того, сколько учащихся должны были бы поступить в вуз

из первой и второй школ с учетом полученных «теоретических» частот 33 и 28,71:
для первой школы
для второй школы
Запишем полученные «теоретические» частоты в новую таблицу
Слайд 91

Таблица 2

Таблица 2

Слайд 92

Вычислим по формуле из величин таблицы 1 вычитаются величины таблицы 2

Вычислим по формуле
из величин таблицы 1 вычитаются величины таблицы 2

Слайд 93

В данном случае число степеней свободы v = (k-1)·(с-1) подсчитывается как

В данном случае число степеней свободы v = (k-1)·(с-1) подсчитывается как

произведение числа столбцов минус 1 на число строк минус 1.
v = (2-1)Δ(2-1)=1, поскольку у нас 2 строки и два столбца.
Слайд 94

В соответствии с таблицей 12 Приложения 1 находим: Построим «ось значимости»,

В соответствии с таблицей 12 Приложения 1 находим:
Построим «ось значимости», на

которой расположим критические значения и полученное эмпирическое значение:
3,841 6,635 20,9

Зона значимости

Зона незначимости

Зона
неопределенности

Слайд 95

Полученная величина эмпирического значения хи-квадрат попала в зону значимости. Следует принять

Полученная величина эмпирического значения хи-квадрат попала в зону значимости.
Следует принять гипотезу

Н1, о наличии различий между двумя эмпирическими распреде-лениями.
Таким образом, уровень подготовленности учащихся в двух школах оказался разным.
На основе эмпирических данных мы можем теперь утверждать, что уровень подготовленнос-ти учащихся в первой школе существенно выше, чем во второй.
Без использования критерия хи-квадрат такого вывода мы сделать бы не могли.
Слайд 96

Замечание. С помощью этого критерия можно решать задачу, в которой сравни-ваются

Замечание. С помощью этого критерия можно решать задачу, в которой сравни-ваются

две выборки, имеющие более чем по два значения в каждой.
Задание. Самостоятельно рассмотрите случаи в учебнике, когда сравниваются две выборки, имеющие по четыре значения в каждой.
Слайд 97

Число переменных в сравниваемых выборках может быть достаточно большим. В этом

Число переменных в сравниваемых выборках может быть достаточно большим.
В этом

случае целесообразно использовать прием разбиения группировки значений по интервалам.
Слайд 98

Алгоритм подсчета эмпирического значения критерия хи-квадрат (2 вариант) : 1. Составить

Алгоритм подсчета эмпирического значения критерия хи-квадрат (2 вариант) :

1. Составить интервальный

ряд.
2. Произвести предварительные расчеты, необходимые для вычисления эмпирического значения критерия xu-квадрат.
При условии разного числа испытуемых в первой и второй выборках вычисления проводятся по формуле:
f1 - частоты первого распределения,
f2 - частоты второго;
n1 и n2 – объемы первой и второй выборок;
N =n1+n2 .
Слайд 99

При условии одинакового числа испытуе-мых в первой и второй выборках вычисле-ния

При условии одинакового числа испытуе-мых в первой и второй выборках вычисле-ния

проводятся по формуле:
f1 - частоты первого распределения,
f2 - частоты второго;
N– объем выборок (n1 = n2 =N ) .
Слайд 100

3. Рассчитать число степеней свободы v = (k – 1) ·(с

3. Рассчитать число степеней свободы
v = (k – 1) ·(с

– 1), где k - число интервалов разбиения, а с – число выборок (у нас с=2).
4. В соответствии с таблицей 12 Приложения 1 определить критические значения соответствующие уровням значимости Р=0,05 и
Р= 0,01 для данного числа степеней свободы.
5. Построить «ось значимости», на которой расположить критические значения и эмпирическое значение .
6. По расположению на оси значимости принять статистическое решение (принять или отклонить гипотезу H1).
7. Сформулировать содержательный вывод.
Слайд 101

Задача. Психолог сравнивает два эмпирических распределения, в каждом из которых было

Задача. Психолог сравнивает два эмпирических распределения, в каждом из которых было

обследовано по тесту интеллекта разное количество испытуемых. Вопрос : различаются ли между собой эти два распределения?
Слайд 102


Слайд 103

Расчет эмпирического значения критерия при условии разного числа испытуемых в первой

Расчет эмпирического значения критерия при условии разного числа испытуемых в первой

и второй выборках производится по формуле:
где f1 – частоты первого распределения;
f2 – частоты второго распределения;
N = n1+n2 – сумма числа элементов в двух выборках.
Из вспомогательной таблицы получаем:
Число степеней свободы ν=(k-1)·(c-1),
где k - число интервалов разбиения,
с - число столбцов.
ν=(10-1)·(2-1)=9.
Слайд 104

В соответствии с таблицей 12 Приложения 1 находим: Построим «ось значимости»,

В соответствии с таблицей 12 Приложения 1 находим:
Построим «ось значимости», на

которой расположим критические значения и полученное эмпирическое значение:
16,92 21,67 23,11

Зона значимости

Зона незначимости

Зона
неопределенности