Статистические методы, оценивающие факторные эффекты и эффекты межфакторного взаимодействия

Содержание

Слайд 2

Неметрические данные: Только сравнение медиан нескольких выборок. Непараметрические тесты для нескольких

Неметрические данные:
Только сравнение медиан нескольких выборок.
Непараметрические тесты для нескольких независимых выборок.
Непараметрические

тесты для нескольких связанных выборок.
Обобщенная линейная модель.
Слайд 3

Обобщенная линейная модель Области применения Метрические и неметрические данные: Оценка факторных

Обобщенная линейная модель

Области применения
Метрические и неметрические данные:
Оценка факторных эффектов и эффектов

межфакторного взаимодействия для неметрических данных – номинальных (бинарных), мультиноминальных, порядковых: Обобщенные линейные модели, Обобщенные уравнения оценки.
Обработка многоуровневых данных: смешанные модели с вложенными факторами: Смешанные модели (Линейная …, Обобщенные линейные).
Слайд 4

Сущность и логика дисперсионного анализа ДА или ANOVA (Analysis of Variance):

Сущность и логика дисперсионного анализа

ДА или ANOVA (Analysis of Variance): оценка

факторных эффектов и межфакторных взаимодействий.
Состоит в разложении (анализе) дисперсии одной или нескольких переменных на составляющие компоненты, сравнивая которые друг с другом с помощью F-критерия, можно оценить ее (их) вклад в общую вариацию данных.
Слайд 5

Термины Уровни НЗП или фактора – пол, возраст, уровень толерантности, место

Термины

Уровни НЗП или фактора – пол, возраст, уровень толерантности, место жительства,

профессия, вид тренинга и т.д.
Однофакторный ДА и многофакторный ДА – сравнение групповых средних и дисперсий по каждому уровню фактора. Оценка главных эффектов.
Межфакторное взаимодействие – сравнение средних и дисперсий по каждому уровню одного фактору на каждом уровне другого фактора.
Ковариата – непрерывная (т.е. не дискретная, НЕ группирующая НЗП), включаемая в регрессионную модель.
Слайд 6

Линейная модель ДА Однофакторный ДА X4,1 = μобщ. + Ф1 +

Линейная модель ДА

Однофакторный ДА
X4,1 = μобщ. + Ф1 + ε4,1
μобщ. –

среднее в популяции, Ф1 - вклад фактора группы 1, ε 4,1 - вклад уникальности 4-го испытуемого, ошибка модели.
Нулевая гипотеза:
H0 :μобщ = μ1 = μ2 = μ3.
Допущения ДА:
Значения ЗП в каждой группе (выборке) нормально распределены вокруг своего среднего.
Равенство (однородность) дисперсий выборочных распределений, соответствующих каждому уровню фактора, т.е. σ12 = σ22 = σ32.
Независимость наблюдений.
Слайд 7

Экстраверсия РГ ЭКГ b ) a Y = ax +b

Экстраверсия

РГ ЭКГ

b

) a

Y = ax +b

Слайд 8

Последствия нарушения допущений ДА Высокая устойчивость или робастность ДА. Особенно при

Последствия нарушения допущений ДА

Высокая устойчивость или робастность ДА. Особенно при условиях:
1.

Объемы выборок равны или отличаются незначительно.
2. Используются выборки большого объема.
Критерии проверки однородности дисперсий: Шеффе, Ливинь и др.
Слайд 9

Как работает ДА Два варианта оценки общей дисперсии данных: Внутригрупповая дисперсия

Как работает ДА

Два варианта оценки общей дисперсии данных:
Внутригрупповая дисперсия - s2WG:

общая дисперсия есть среднее арифметическое групповых дисперсий. Отражает влияние случайных факторов:
Межгрупповая (факторная) дисперсия - s2BG: отражает не случайную, а систематическую вариацию, т.е. является оценкой разброса самих выборочных (групповых) средних:
Слайд 10

F-отношение или F-критерий В формулах обе дисперсии заменяются своими суммами квадратов,

F-отношение или F-критерий

В формулах обе дисперсии заменяются своими
суммами квадратов, деленными

на соответствующие
степени свободы:
k – это число уровней фактора или сравниваемых групп,
N – это число испытуемых.

Чем больше факторная дисперсия,
тем больше F.

Слайд 11

Нулевая гипотеза в ДА: - однофакторный, - многофакторный, - повторные измерения.

Нулевая гипотеза в ДА: - однофакторный, - многофакторный, - повторные измерения.

Слайд 12

Множественные сравнения средних Используемые тесты, с учетом или без учета однородности

Множественные сравнения средних

Используемые тесты, с учетом или без учета однородности дисперсий

выборок:
Шеффе
Бонферони
НЗР
Хауэлла
Слайд 13

Оценка силы факторного эффекта η2 (эта квадрат):

Оценка силы факторного эффекта

η2 (эта квадрат):

Слайд 14

Две модели ДА В модели ДА с фиксированными эффектами исследователь намеренно

Две модели ДА

В модели ДА с фиксированными эффектами исследователь намеренно устанавливает

строго определенные уровни изучаемого фактора.
В модели со случайными эффектами уровни значения фактора выбираются исследователем случайно из широкого диапазона изменений фактора. Вложенные факторы. Нестинг-модели. Многоуровневые модели.
Слайд 15

Критические значения F-распределения для уровня значимости p = 0.05. Планирование значимости факторного эффекта

Критические значения F-распределения для уровня значимости p = 0.05.

Планирование значимости факторного

эффекта
Слайд 16

Многофакторный дисперсионный анализ Factorial Analysis of Variance, ОЛМ-одномерная. Линейная модель ДА:

Многофакторный дисперсионный анализ

Factorial Analysis of Variance, ОЛМ-одномерная.
Линейная модель ДА:
Xijg = mобщ.

+ Фj + Фg + Фj * Фg +eijg
Формулировка статистических гипотез:
Отдельно по фактору i: вариации средних по уровням фактора i – случайны.
Отдельно по фактору j: вариации средних по уровням фактора j – случайны.
Для взаимодействия факторов i и j:
влияние фактора i различно при разных уровнях фактора j, и наоборот.
Слайд 17

Студент РГ ЭКГ МД/МИН Тр./НТр. И/Э

Студент

РГ ЭКГ

МД/МИН

Тр./НТр.

И/Э

Слайд 18

Проблемы ДА с большим числом факторов: X = μобщ, + Фj

Проблемы ДА с большим числом факторов:
X = μобщ, + Фj +

Фg + Фk + Фj *Фg + Фj *Фk +
+ Фi *Фk + Фi * Фj *Фk +εijk
Итого – 8 компонентов дисперсии…
Слайд 19

ДА с повторными измерениями – ОЛМ-повторные измерения Xij = μобщ. +

ДА с повторными измерениями – ОЛМ-повторные измерения
Xij = μобщ. + Фj

+pi + Фj×pji +εij, где
pi - компонент, связанный с влиянием индивидуальности i-го испытуемого, Фj×pji - дополнительный эффект взаимодействия этих двух компонент.
Особенность – данные повторных измерений связаны друг с другом, не являются независимыми. Следовательно можно и нужно учесть вклад индивидуальных различий испытуемых.
Преимущество: при вычислении знаменателя F-отношения – s2WG , из него вычитается межиндивидуальная вариация, получаются более высокие оценки.
Слайд 20

Две модели оценки факторных эффектов Одномерная модель: 1) применяется F-отношение, 2)

Две модели оценки факторных эффектов

Одномерная модель: 1) применяется F-отношение,
2) имеет ограничения

по допущению о сферичности
ковариационно-дисперсионной матрицы, т.е. дисперсии зависимой переменной для разных уровней внутригруппового фактора не различаются и корреляции между повторными измерениями есть и они положительны; 3) проверяется с помощью теста сферичности ковариационно-дисперсионной матрицы Моучли (р<0,05).
Слайд 21

Эмпирические оценки F-отношения и степеней свободы

Эмпирические оценки F-отношения и степеней свободы

Слайд 22

Дополнительное допущение для ДА с повторными измерениями Допущение о симметричности ковариационной

Дополнительное допущение для
ДА с повторными измерениями
Допущение о симметричности ковариационной матрицы уровней

факторов (в б. общем плане - сферичности).
1 фактор, 3 уровня:
Слайд 23

Две модели оценки факторных эффектов Многомерная модель: 1) свободна от допущения

Две модели оценки факторных эффектов

Многомерная модель: 1) свободна от допущения о

коррелированности измерений зависимой переменной (т.е. о сферичности); 2) используются многомерные тесты - След Пиллая» и «λ-Вилкса»; 3) при оценки межгрупповых факторов с помощью М-теста Бокса дополнительно проверяется допущение об идентичности ковариационно-дисперсионных матриц (p>0,05).
Слайд 24

MANOVA или ОЛМ-многомерная Не требует допущения о сферичности. Менее мощная процедура.

MANOVA или ОЛМ-многомерная

Не требует допущения о сферичности.
Менее мощная процедура. Особенно на

малых выборках.
Предполагается связь между рядом ЗП.
Резоны: учет интеркорреляции между ЗП-ми.
Допущения:
Многомерное нормальное распределение.
Для каждого уровня фактора ЗП образовывают одну и туже дисперсионно-ковариационную матрицу (квадратная матрица, на диагонали которой лежат дисперсии переменных, а ее элементами - коэффициенты ковариации между переменными).
Слайд 25

Что проверяем в случае использования F-критерия? Если используем F-критерий, то делаем:

Что проверяем в случае использования F-критерия?

Если используем F-критерий, то делаем:
М-тест Бокса:

оценка равенства дисперсионно-ковариационных матриц для каждого уровня фактора (p>0,05). Аналогично требованию однородности дисперсий в ANOVA.
Используем многомерные критерии: след Пиллая, λ-Вилкса, след Хотеллинга и критерий Роя.
Для оценки скоррелированности ЗП используем тест Бартлетта на сферичность (р<0,05).
Слайд 26

А внутригрупповые факторы? Есть возможность включать в многомерный ДА не только

А внутригрупповые факторы?

Есть возможность включать в многомерный ДА не только межгрупповые,

но и внутригрупповые факторы, однако она реализуется с помощью специального командного режима выполнения статистических процедур (Comand Syntex).
Или: использовать ОЛМ-повторные измерения, включая несколько ЗП.
Слайд 27

Непараметрические процедуры Ранговые критерии для сравнения нескольких выборок - аналоги классического

Непараметрические процедуры

Ранговые критерии для сравнения нескольких выборок - аналоги классического ДА.
Пример

«работы» непараметрического критерия Фридмана. Основная идея: если между группами нет различия, то а) ранжирование наблюдений будет случайным и б) средние ранги разных переменных будут примерно одинаковыми.
где К - число совпадающих наблюдений, j - число групп, Т - сумма рангов в каждой группе. 
Слайд 28

Классификация критериев по типу решаемых задач Критерии для несвязанных выборок Н-критерий

Классификация критериев по типу решаемых задач

Критерии для несвязанных выборок
Н-критерий Краскела-Уоллеса
Медианный критерий
Критерий

Джонкхиера-Терпстры
 Критерии для связанных выборок
Критеий Фридмана
W-критерий Кендала
Q-критерий Кокрена
Ограничение для Н-критерий Краскела-Уоллеса: распределения имеют схожую форму.
Слайд 29

Классификация критериев по типу решаемых задач Критерии для ранговых данных и

Классификация критериев по типу решаемых задач

Критерии для ранговых данных и критерий для

дихотомических (бинарных) переменных:
Для ранговых данных: Н-критерий Краскела-Уоллеса, Медианный критерий, Критерий Джонкхиера-Терпстры, W-критерий Кендала, Критеий Фридмана.
 Для дихотомических данных (0 или 1): Q-критерий Кокрена.
Слайд 30

Классификация критериев по типу решаемых задач Критерии для простого сравнения выборок

Классификация критериев по типу решаемых задач

Критерии для простого сравнения выборок и критерии,

учитывающие определенную упорядоченность сравниваемых выборок:
Простое сравнение (менее мощные): Н-критерий Краскела-Уоллеса, Медианный критерий, W-критерий Кендала, Критеий Фридмана
Учет упорядоченности (более мощный): критерий Джонкхиера-Терпстры, критерий Пейджа.
Выявляют различия там, где обычные критерии (Крускала-Уоллиса, Фридмана и др.) дают отрицательный результат.
Слайд 31

Примеры эмпирических данных Шкала экзистенции.sav – однофакторный ДА. Оценить значимость различий

Примеры эмпирических данных

Шкала экзистенции.sav – однофакторный ДА. Оценить значимость различий 3-х

групп испытуемых (переменные – возраст и образование) по порядковым шкалам SD, ST, P, F, EG.
Индивид и музыка. sav - непараметрический критерий для непарных выборок.
Оценить значимость различий по предпочтению музыки между группами испытуемых, различающихся по семейному положению, образованию и национальности c помощью подходящего непараметрического критерия для непарных выборок.
Слайд 32

Примеры эмпирических данных MANOVA.sav - процедура ОЛМ-многомерная. Оценить значимость различий по

Примеры эмпирических данных

MANOVA.sav - процедура ОЛМ-многомерная.
Оценить значимость различий по факторам «экстраверсия»

и «нейротизм» а также эффект межфакторного взаимодействия. Оценить силу оцениваемых эффектов, построить соответствующие графики и полезные таблицы.
Тренинг личностного роста_СЖО.sav.
Оценить влияния на шкалы опросника межгруппового фактора «Группа испытуемых» (контрольная и экспериментальная – которая проходила тренинг) и внутригруппового фактора «Время тестирования» (до тренинга и после тренинга).
Слайд 33

Примеры эмпирических данных Когнитивные стили, темперамент и СКИ.sav - процедуры: ОЛМ-одноомерная,

Примеры эмпирических данных

Когнитивные стили, темперамент и СКИ.sav - процедуры: ОЛМ-одноомерная, ОЛМ-многомерная.
Оценить

значимость различий во времени решения задач 3-х уровней сложности и общего времени в зависимости от 2-х когнитивных стилей, экстраверсии и нейротизма, их взаимодействия. Оценить силу оцениваемых эффектов, построить соответствующие графики и таблицы.
Слайд 34

Работа с ковариатами Зачем нужна ковариата: Наличие непрерывной (не группирующей) переменной

Работа с ковариатами

Зачем нужна ковариата:
Наличие непрерывной (не группирующей) переменной как предиктора

ЗП.
Желание построить более сложную модель.
Желание получить статистически значимый эффект за счет усложнения модели.
Xijg = mобщ. + Фj + Фg + Фj * Фg + CovIQ+ eijg
Слайд 35

Примеры эмпирических данных Церковь и гасторбайтеры.sav – однофакторный ДА с ковариатой.

Примеры эмпирических данных

Церковь и гасторбайтеры.sav – однофакторный ДА с ковариатой. Оценить

значимость различий 2-х групп испытуемых (редко или часто посещают церковь) в их отношении к гасторбайтерам. Ковариата – возраст.
Смотрим на значимость и силу факторного эффекта.