Двухфакторный дисперсионный анализ

Содержание

Слайд 2

ПЛАН: ВВЕДЕНИЕ Назначение Обработка двухфакторного дисперсионного комплекса Схема двухфакторного дисперсионного анализа

ПЛАН:
ВВЕДЕНИЕ
Назначение
Обработка двухфакторного дисперсионного комплекса
Схема двухфакторного дисперсионного анализа
Разновидности метода
-есть повторные измерения
-нет повторных

измерений
Пример
Заключение
Литература
Слайд 3

Техника дисперсионного анализа полезна для ряда статистических задач, связанных с исследованием

Техника дисперсионного анализа полезна для ряда статистических задач, связанных с исследованием

влияния одной или нескольких качественных переменных (факторов) на одну зависимую количественную переменную (отклик).

ВВЕДЕНИЕ

Слайд 4

Общая дисперсия: Факториальная дисперсия: Случайная дисперсия: Где Х – отдельное значение

Общая дисперсия:
Факториальная дисперсия:
Случайная дисперсия:
Где Х – отдельное значение результативного признака
Хс

– общая средняя арифметическая всего комплекса
Хф – групповая средняя
Слайд 5

Посредством данного метода в зависимости от типа модели по каждому фактору


Посредством данного метода в зависимости от типа модели по каждому фактору

(с фиксированными или же со случайными эффектами) с помощью параметрического критерия Фишера проверяется одна из двух нулевых гипотез:
средние значения для групп откликов, измеренных при различных значениях фактора, не имеют существенных различий между собой;
дисперсия средних значений для групп откликов, измеренных при различных значениях фактора, не отлична от нуля.

Назначение.

Слайд 6

Обработка двухфакторного дисперсионного комплекса 1. Вычисление общей дисперсии осуществляется как при

Обработка двухфакторного дисперсионного комплекса

1. Вычисление общей дисперсии осуществляется как при однофакторном

комплексе
2. Вычисление случайной дисперсии аналогично нахождению ее в однофакторном комплексе

3. Вычисление дисперсии суммарного действия организованных факторов

Слайд 7

Схема двухфакторного дисперсионного анализа

Схема двухфакторного дисперсионного анализа

Слайд 8

В двухфакторном дисперсионном анализе испытуемые гипотезы формулируются следующим образом: Н0 :

В двухфакторном дисперсионном анализе испытуемые гипотезы формулируются следующим образом:
Н0 : μ1•

= μ2. =…μm  
2. Н0 : μ1• = μ2. =…μp  
3. Н0 : μ1• = μ2. =…μmp  
Слайд 9

Имеется две разновидности метода в зависимости от того, производились ли повторные

Имеется две разновидности метода в зависимости от того, производились ли повторные

измерения при каждом сочетании двух исследуемых факторов или нет.
Слайд 10

При эксперименте без повторных измерений исходные данные должны представлять собой матрицу

При эксперименте без повторных измерений исходные данные должны представлять собой матрицу

размером m⋅n, в которой столбцы отвечают различным уровням первого фактора j=1,...,m, строки отвечают различным уровням второго фактора i=1,...,n, а каждая ячейка содержит отклик измеренный при соответствующем сочетании уровней исследуемых факторов.
Выдача: выдача включает дисперсионную таблицу со столбцами: сумма квадратов, число степеней свободы, средняя сумма квадратов, сила влияния фактора (по Снедекору), а строки содержат значения для первого и второго факторов, а так же остаточные и общие параметры.
Далее для каждого фактора вычисляется статистика Фишера F с уровнем значимости P. Если P>0.05, нулевая гипотеза об отсутствии влияния фактора может быть принята.

Нет повторных измерений.

Слайд 11

При эксперименте с повторными измерениями исходные данные должны представлять собой псевдоматрицу

При эксперименте с повторными измерениями исходные данные должны представлять собой псевдоматрицу

(не обязательно одинаковой длинны столбцов), в которой переменные (i=1,..., m⋅n) отвечают различным уровням исследуемых факторов в порядке изменения значений первого фактора: все уровни первого фактора для первого уровня второго фактора, все уровни первого фактора для второго уровня второго фактора и т.д., а каждая переменная содержит откликов ( >1), измеренных при данном сочетании значений факторов.

Есть повторные измерения.

Слайд 12

Выдача: выдача включает дисперсионную таблицу со столбцами: сумма квадратов, число степеней

Выдача: выдача включает дисперсионную таблицу со столбцами: сумма квадратов, число степеней

свободы, средняя сумма квадратов, сила влияния фактора (по Снедекору), а строки содержат значения для первого и для второго факторов, для эффекта межфакторного взаимодействия, а так же остаточные и общие параметры.
Далее для каждого фактора вычисляется статистика Фишера F с уровнем значимости P. Если P>0.05, нулевая гипотеза об отсутствии влияния фактора может быть принята.
Если эффект взаимодействия не обнаружен, то проводится дополнительный анализ по факторам A и B, но без учета их взаимодействия. Такой дополнительный анализ, как правило, дает более низкий уровень значимости нулевых гипотез. Полученными результатами рекомендуется пользоваться, если уровень значимости гипотезы отсутствия взаимодействия факторов достаточно велик (P>0.05).

Есть повторные измерения.

Слайд 13

Формулы. В случае двухфакторного эксперимента без повторных измерений дисперсионная таблица имеет

Формулы.
В случае двухфакторного эксперимента без повторных измерений дисперсионная таблица имеет

вид:
где:





F - статистика.

Бесповторный эксперимент.

Слайд 14

В случае двухфакторного эксперимента с повторными измерениями и с фиксированными эффектами

В случае двухфакторного эксперимента с повторными измерениями и с фиксированными эффектами

дисперсионная таблица имеет вид:

Повторы и фиксированные эффекты.

где:

- сумма откликов для i - ой группы, i = 1,2,...,n⋅m; N - общее число откликов;

) - сумма средних значений откликов для a - уровня (b - уровня) фактора 1 (фактора 2);

(

F - статистики с n-1, n⋅m⋅(k-1); m-1, n⋅m⋅(k-1); (n-1)⋅(m-1), n⋅m⋅(k-1) степенями свободы, k=N/

.

Слайд 15

Отличие модели со случайными эффектами состоит в замене второго числа степеней

Отличие модели со случайными эффектами состоит в замене второго числа степеней

свободы в - статистиках (n-1)⋅(m-1);

,

Отличие модели с рандомизованными блоками состоит в замене второго числа степеней свободы в - статистиках (n-1)⋅(m-1);

Отличие модели с группировкой - вычисляются два F - значения:

=A/B с n-1, n⋅m⋅(k-1) степенями свободы;

=B/E с n⋅(m-1), n⋅m⋅(k-1) степенями свободы, вычисление межфакторного взаимодействия не производится;
В случае незначительного межфакторного взаимодействия при повторных вычислениях

,

используется E=E+AB с (n-1)⋅(m-1)+N-n⋅m степенями свободы.

Примечания.

Слайд 16

Слайд 17

Слайд 18

Слайд 19

Слайд 20

Пример. Матрица, четыре переменные в которой представляют результаты побед в четырех

Пример.
Матрица, четыре переменные в которой представляют результаты побед в четырех видах

спорта (плавание, борьба, прыжки в высоту, шахматы - 1-й, 2-й, 3-й, 4-й столбцы соответственно). Необходимо выяснить, влияет ли вес и рост спортсменов на их спортивные достижения. Замеры веса и роста проводились через равные промежутки времени у спортсменов примерно одинаковой квалификации, но с разными показателями роста и веса.
Исходные данные:
Результаты:
2-ФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ.
Факторный план: неповторяемый
F(фактор1)=0,69, Значимость=0,578, степ.своб = 3,12
Гипотеза 0: <Нет влияния фактора на отклик>
F(фактор2)=2,78, Значимость=0,0758, степ.своб = 4,12
Гипотеза 0: <Нет влияния фактора на отклик>
Параметры модели:
Среднее = 9,85, доверит.инт.=3,48
Эффект1-1 = -0,85, доверит.инт.=28
Эффект1-2 = 0,55, доверит.инт.=28
Эффект1-3 = 0,55, доверит.инт.=28
Эффект1-4 = -0,25, доверит.инт.=28
Эффект2-1 = -0,6, доверит.инт.=33,5
Эффект2-2 = -1,1, доверит.инт.=33,5
Эффект2-3 = -0,85, доверит.инт.=33,5
Эффект2-4 = 2,65, доверит.инт.=33,5
Эффект2-5 = -0,1, доверит.инт.=33,5
Вывод: Дисперсионный анализ не обнаруживает существенного влияния роста и веса спортсменов на количество побед в соревнованиях.
Слайд 21

ЗАКЛЮЧЕНИЕ Следует отметить, что принципиальной разницы между двухфакторным и однофакторным дисперсионным

ЗАКЛЮЧЕНИЕ

Следует отметить, что принципиальной разницы между двухфакторным и однофакторным дисперсионным анализом

нет. Двухфакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных двухфакторный дисперсионный анализ, касается в основном возможности оценить межфакторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура двухфакторного дисперсионного анализа более экономична, поскольку решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие.
Слайд 22

2 ′ ′ Ф ′ ′ цвет ′ ′ ′ ′ ′ ′ ′ ′ З

2



Ф



цвет









З