Дисперсионный анализ. Лекция 5

Содержание

Слайд 2

Назначение дисперсионного анализа Дисперсионный анализ (ДА) (от латинского Dispersio – рассеивание

Назначение дисперсионного анализа

Дисперсионный анализ (ДА) (от латинского Dispersio – рассеивание / на

английском Analysis Of Variance - ANOVA) применяется для оценки влияния одного или нескольких входных параметров на выходной параметр (функцию). 
ДА позволяет ранжировать входные параметры по степени их прямого и взаимного влияния на функцию.

Чем больше параметров требуется учитывать, тем дороже проведение эксперимента.

Согласно закону Парето (принцип 20/80), значимых факторов немного, т.е. примерно 20% параметров дают 80% результата, а остальные 80% параметров — лишь 20% результата.

Слайд 3

Особенности дисперсионного анализа, дисперсионные модели одно-, двух- и трех факторного эксперимента

Особенности дисперсионного анализа, дисперсионные модели одно-, двух- и трех факторного эксперимента


Дисперсионный анализ предназначен для качественного исследования модели процесса: y = f ( x1, x2, ... , xk ) на предмет оценки значимости каждого входного параметра на функцию У.
Математический аппарат, который занимается исследованием значимости входных параметров, называется дисперсионным анализом. В его основе лежит анализ вкладов каждого фактора в общую дисперсию эксперимента.

Слайд 4

Рассмотрим однофакторный эксперимент: y = f (x1). Дисперсионную модель этого эксперимента

Рассмотрим однофакторный эксперимент: y = f (x1). Дисперсионную модель этого эксперимента

можно представить в виде: y = A + ε ,

где У - общий вклад в общую дисперсию, который вносят все факторы; А - эффект фактора Х1, ε - эффект ошибки воспроизводимости.

ε рассчитывается в случае, если хотя бы в одной точке Хi проведено более одного эксперимента (Уi1, Уi2, Уi3).
Если в каждой точке Хi проведен только один эксперимент, то ε = 0.

Слайд 5

Дисперсионная модель двухфакторного эксперимента y = f(x1, x2) строится с учетов

Дисперсионная модель двухфакторного эксперимента y = f(x1, x2) строится с учетов

эффекта совместного влияния факторов Х1 и Х2:
y = A + B + AB + ε ,
где А и В – эффекты факторов Х1 и Х2;
АВ – эффект совместного влияния (взаимодействия) факторов Х1 и Х2 (АВ=0, если функции сепарабельные);
ε – эффект ошибки воспроизводимости.

Дисперсионная модель трехфакторного эксперимента строится по аналогии и будет содержать не только эффекты парных (AB, AC и BC) , но и тройного взаимодействия (ABC):
y = A + B + C + AB + AC + BC + ABC +ε

Слайд 6

Для первого случая: У = А + f(X1) + f(X2) Каждая

Для первого случая:
У = А + f(X1) + f(X2)
Каждая

функция f(X1) и f(X2) зависят только от одной переменной, а сами переменные (Х1 и Х2) независимы друг от друга.
Семейство функций У = А + f(X1) + f(X2) называется сепарабельными функциями.

Для второго случая:
У = А + f(X1) + f(X2) + f(X1)*f(X2)
Член уравнения f(X1)*f(X2) показывает степень взаимодействия параметров Х1 и Х2 на функцию У.

Вспомним о сепарабельных функциях:

Слайд 7

В качестве количественного показателя, применяемого для сравнения эффектов факторов Х1, Х2

В качестве количественного показателя, применяемого для сравнения эффектов факторов Х1, Х2

и др., используется критерий Фишера:

где Si2, S02 – дисперсии соответственно i-того и наименее значимого фактора (обычно от эффекта ошибки воспроизводимости ε);
FT – табличное (критическое) значение критерия Фишера;
fi и f0 – степени свободы i-того и 0-го факторов;
р – доверительная вероятность (обычно р=0,95).

Слайд 8

Дисперсионную модель наиболее удобно представлять в виде гистограммы: Таким образом, для

Дисперсионную модель наиболее удобно представлять в виде гистограммы:

Таким образом, для проведения

ДА нужно уметь рассчитывать критерии Фишера, т.е. уметь определять значения дисперсий S2i, среднеквадратических отклонений SSi и степеней свободы fi.
Слайд 9

Основные уравнения ДА Рассмотрим двухфакторный эксперимент. Уровни входных параметров (факторов) Х1

Основные уравнения ДА

Рассмотрим двухфакторный эксперимент.

Уровни входных параметров (факторов) Х1 и

Х2 откладываются по осям координат.
Фактор Х1 измеряется на а равностоящих уровнях.
Счетчик уровней для Х1:
i = 1, 2, …a.

Фактор Х2 измеряется на b равностоящих уровнях.
Счетчик уровней для Х2: j = 1, 2, …b.
В каждой узловой точке эксперимента проводится по n опытов.
n также является фактором, от которого зависит эффект ошибки воспроизводимости ε. Счетчик уровней по n: k = 1, 2, …, n

Слайд 10

Таким образом, полный факторный эксперимент (ПФЭ) будет содержать Nn = a*b*n

Таким образом, полный факторный эксперимент (ПФЭ) будет содержать Nn = a*b*n

опытов. Если в каких-то точках опыты не проводятся, то эксперимент называется дробным факторным (ДФЭ).
Для ПФЭ выходной параметр У будет иметь три индекса: i, j, k. Т.е. обозначение Уijk будет определять значение выходного параметра в ijk узловой точке, согласно ПФЭ.

Определим общее число степеней свободы fобщ эксперимента:
fобщ = abn – 1.
Число степеней свободы каждого из факторов Х1 и Х2:
fx1 = f1 = a – 1 ; fx2 = f2 = b – 1 .
Число степеней свободы взаимодействия:
f12 = (a - 1 )( b - 1 ) .
Число степеней свободы ошибки воспроизводимости по ab точкам:
fо = ab( n - 1 ).

Слайд 11

Согласно первому основному уравнению дисперсионного анализа: fобщ = f1 + f2

Согласно первому основному уравнению дисперсионного анализа: fобщ = f1 + f2

+ f12 + fо .

Это уравнение легко получить, если преобразовать правую часть тождества:
abn - 1 = (a -1) + (b - 1) + (a – 1)(b - 1) + ab(n - 1).

По аналогии можно получить первое основное уравнение для трехфакторного эксперимента:
fобщ = f1 + f2 + f3 + f12 + f13 + f23 + f123 + fо .
Число уровней фактора Х3 равно с (счетчик s = 1, 2, ... , c ). Недостающие числа степеней свободы равны:
f3 = c – 1; f123 = (a - 1)(b - 1)(c - 1) ; fо = abc(n - 1).

Слайд 12

Общее среднеквадратичное отклонение для двухфакторного эксперимента можно рассчитать по формуле: В

Общее среднеквадратичное отклонение для двухфакторного эксперимента можно рассчитать по формуле:

В ДА

для компактности записи расчетных формул знак суммирования заменяется звездочкой, т.е.:

(2)

Раскрыв скобки и преобразовав уравнение (2), получим:

(3)

Слайд 13

Уравнение (3) состоит из четырех слагаемых, каждое из которых соответственно равно

Уравнение (3) состоит из четырех слагаемых, каждое из которых соответственно равно

SS1, SS2, SS12 и SS0.
После преобразований уравнения (2) для SSобщ и каждого из слагаемых в уравнении (3), получим:
Слайд 14

Соотношение между суммами квадратов отклонений подчиняется второму основному уравнению ДА: SS

Соотношение между суммами квадратов отклонений подчиняется второму основному уравнению ДА:
SS общ

= SS1 + SS2 + SS12 + SSо
По аналогии для трехфакторного эксперимента:
SS общ = SS1 + SS2 + SS3 + SS12 + SS13 + SS23 + SS123 + SSо

Между выражениями для расчета числа степеней свободы и суммы квадратов отклонений существует аналогия.

Слайд 15

количество слагаемых и знаки перед ними в выражениях для числа степеней

количество слагаемых и знаки перед ними в выражениях для числа степеней

свободы и соответствующей суммы квадратов отклонений совпадают;
в каждом слагаемом для SS знаки Σ содержат индексы, аналогичные индексам при f ;
3) эти же индексы присутствуют в числителе при y2, а
недостающие индексы числителя заменены звездочками;
4) знаменатель можно записать по недостающим индексам числителя, которые в числителе обозначаются звездочками.

Аналогии между выражениями для расчета SSi и fi

Эту аналогию используем в качестве правила для формального написания суммы квадратов отклонений.
Для этого сначала необходимо написать выражение для числа степеней свободы и раскрыть в нем скобки. Затем, придерживаясь п.1 – 4, написать соответствующие члены искомых сумм.

Слайд 16

Вывод формул для расчета суммы квадратов отклонений SSi по формальным правилам

Вывод формул для расчета суммы квадратов отклонений SSi по формальным правилам


Слайд 17

Для трехфакторного эксперимента имеем: f123 = (a -1)(b -1)(c -1) =

Для трехфакторного эксперимента имеем:
f123 = (a -1)(b -1)(c -1) = abc

- ab - ac - bc + a + b + c - 1.
Слайд 18

y2***=(y111+y112+…y11n+y121+…y12n+…yabn)2 В ДА для компактности записи расчетных формул знак суммирования заменяется звездочкой:

y2***=(y111+y112+…y11n+y121+…y12n+…yabn)2

В ДА для компактности записи расчетных формул знак суммирования заменяется звездочкой:

Слайд 19

Рассмотрим пример двухфакторного эксперимента Пусть уровни варьирования параметров a и b

Рассмотрим пример двухфакторного эксперимента

Пусть уровни варьирования параметров a и b меняются

от 1 до 2. В каждой точке проводится по два эксперимента (n=2). Т.е. а = 2 (i=1,2); b = 2 (j=1,2); n = 2 (s=1,2).
В каждой ijs-эксперименте зафиксированы следующие значения выходного параметра У:

Рассчитать суммы квадратов для двухфакторного эксперимента.

Слайд 20

Расчет сумм квадратов

Расчет сумм квадратов

Слайд 21

Проверка: fобщ.= f1+f2+f12+f0= 1+1+1+4=7 SSобщ.=SS1+SS2+SS12+SSo=2+8+0+32=42

Проверка: fобщ.= f1+f2+f12+f0= 1+1+1+4=7
SSобщ.=SS1+SS2+SS12+SSo=2+8+0+32=42