Дисперсионный анализ

Содержание

Слайд 2

Дисперсионный анализ — раздел математической статистики, связанный с методами выявления влияния

Дисперсионный анализ — раздел математической статистики, связанный с методами выявления влияния

отдельных факторов на результат эксперимента (физического, производственного, экономического).
Слайд 3

Дисперсионный анализ исходит из положения о том, что существенность фактора в

Дисперсионный анализ исходит из положения о том, что существенность фактора в

определенных условиях характеризуется его вкладом в дисперсию результата.
Английский статистик Р. Фишер, разработавший этот метод, определил его как “отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам”.
Слайд 4

Анализ производится следующим образом. 1 Сначала группируют совокупность наблюдений по факторному

Анализ производится следующим образом.
1
Сначала группируют совокупность наблюдений по факторному

признаку, находят среднее значение результата и дисперсию по каждой группе.
Слайд 5

2 Затем определяют общую дисперсию и вычисляют, какая доля ее зависит

2
Затем определяют общую дисперсию и вычисляют, какая доля ее зависит от

условий, общих для всех групп, какая — от исследуемого фактора, а какая — от случайных причин.
Слайд 6

3 И наконец, с помощью специального критерия определяют, насколько существенны различия

3
И наконец, с помощью специального критерия определяют, насколько существенны различия между

группами наблюдений и, следовательно, можно ли считать ощутимым влияние тех или иных факторов.
Слайд 7

Дисперсионный анализ применяется в планировании эксперимента и в ряде исследований, где

Дисперсионный анализ применяется в планировании эксперимента и в ряде исследований, где

он служит, в частности, предварительным этапом к регрессионному анализу статистических данных, поскольку позволяет выделить относительно небольшое (но достаточное для целей исследования) количество параметров регрессии.
Слайд 8

В дисперсионном анализе рассматривается эксперимент, в котором производится варьирование при фиксированных

В дисперсионном анализе рассматривается эксперимент, в котором производится варьирование при

фиксированных уровнях некоторыми факторами. В результате возникает продукт с выходным параметром, имеющим вероятностный характер.
Слайд 9

Обычно принимается предположение о нормальном законе распределения выходной характеристики этого параметра. .

Обычно принимается предположение о нормальном законе распределения выходной характеристики этого параметра.


.
Слайд 10

Нормальное распределение вызвано погрешностью измерений, влиянием контролируемых условий и т.д., оно

Нормальное распределение вызвано погрешностью измерений, влиянием контролируемых условий и т.д., оно

проявляется при проведении повторных опытов (партии опытов) в «одной точке» - при каждом конкретном сочетании уровней факторов.
Слайд 11

Слайд 12

Вторым предположением является однородность дисперсий в «различных точках» - при различных сочетаниях уровней факторов.

Вторым предположением является
однородность дисперсий в «различных точках» - при различных

сочетаниях уровней факторов.
Слайд 13

Для удобства в упрощенном виде рассмотрим однофакторный дисперсионный анализ, а затем двухфакторный и трехфакторный.

Для удобства в упрощенном виде рассмотрим однофакторный дисперсионный анализ, а затем

двухфакторный и трехфакторный.
Слайд 14

Однофакторный эксперимент

Однофакторный эксперимент

Слайд 15

Проверяют однородность ряда дисперсий по критерию Кохрена . Если расчетное значение

Проверяют однородность ряда дисперсий по критерию Кохрена . Если расчетное значение

критерия окажется больше табличного значения при принятом уровне значимости α и количестве наблюдений,
то гипотеза об однородности дисперсий отвергается.
Слайд 16

После подтверждения гипотезы об однородности этих дисперсий находят общее среднее Далее

После подтверждения гипотезы об однородности этих дисперсий находят общее среднее

Далее вычисляются

дисперсии:
- характеризующую рассеяние по факторам;
- остаточную дисперсию, характеризующую рассеяние внутри партий;
- полную (общую) дисперсию, отражающую общее рассеяние как внутри партий, так и за счет изменения уровня фактора
Слайд 17

Слайд 18

Слайд 19

Слайд 20

Для выяснения вопроса о том, сказывается ли влияние фактора А, или

Для выяснения вопроса о том, сказывается ли влияние фактора А, или

это влияние несущественно по сравнению с разбросом внутри партии, проверяют однородность дисперсий и при помощи критерия Фишера.

Если это отношение окажется меньше табличного значения , найденного для числа степеней свободы и и уровня значимости α, то влияние фактора несущественно.

Слайд 21

Если влияние фактора несущественно, то все результаты испытаний принадлежат одной генеральной

Если влияние фактора несущественно, то все результаты испытаний принадлежат одной генеральной

совокупности, распределенной нормально с параметрами
и
Их точечные оценки соответственно равны
и , а интервальные для (верхняя и нижняя границы)
Слайд 22

Если влияние фактора существенно, то считается, что есть k нормально распределенных

Если влияние фактора существенно, то считается, что есть k нормально распределенных

совокупностей, каждая из которых имеет дисперсию с разными средними значениями . Точечной оценкой является , а оценкой средних - выборочные средние . Доверительные интервалы для и имеют следующий вид:
Слайд 23

Двухфакторный дисперсионный анализ

Двухфакторный дисперсионный анализ

Слайд 24

Ниже приведены результаты испытаний для двухфакторного анализа. Один из факторов x1

Ниже приведены результаты испытаний для двухфакторного анализа. Один из факторов x1

имеет k уровней, другой x2 – m. При каждой комбинации уровней производится одинаковое количество n опытов.
Слайд 25

Слайд 26

Сначала рассчитываются средние значения случайной величины Y для каждой партии опытов:

Сначала рассчитываются средние значения случайной величины Y для каждой партии опытов:

затем

средние значения по графам (по фактору x2) и по строчкам (по фактору x1):

и среднее значение наблюдений


или

Слайд 27

Расчет средних значений и дисперсий

Расчет средних значений и дисперсий

Слайд 28

Далее вычисления рассчитываются дисперсии - между средними по графам - между

Далее вычисления рассчитываются дисперсии

- между средними по графам

- между средними по

строкам

- при взаимодействии между факторами

- внутри партии (остаточная)

- полная (общая) дисперсия)

Слайд 29

Слайд 30

Далее с помощью критерия Фишера проверяют гипотезу об отсутствии взаимодействия между

Далее с помощью критерия Фишера проверяют гипотезу об отсутствии взаимодействия между

исследуемыми факторами.

Расчетное значение критерия сопоставляют с табличным, найденным для уровня значимости α и числа степеней свободы

и

Слайд 31

Если расчетное значение критерия больше табличного, то гипотеза о независимости факторов

Если расчетное значение критерия больше табличного, то гипотеза о независимости факторов

x1 и x2 отвергается. Если же оно меньше, то гипотеза об отсутствии связи подтверждается.
Слайд 32

Далее проверяют значимость влияния обоих факторов на исследуемую величину Y. Для

Далее проверяют значимость влияния обоих факторов на исследуемую величину Y. Для

этого предварительно объединяют оценки дисперсий взаимодействия между факторами и остаточную

и вычисляют отношения

и

Слайд 33

Если расчетные значения больше табличных, то влияние факторов значимо. В этом

Если расчетные значения больше табличных, то влияние факторов значимо. В этом

случае мы имеем дело с k*m нормально распределенными генеральными совокупностями с общей дисперсией и разными значениями

Их оценками служат выборочная дисперсия S20 и выборочные средние для каждой комбинации факторов

Слайд 34

Если расчетные значения критериев меньше табличных, то влияние обоих факторов на

Если расчетные значения критериев меньше табличных, то влияние обоих факторов на

параметр Y не значимо. В этом случае мы имеем дело с одной генеральной совокупностью с дисперсией и математическим ожиданием

Оценкой служит общее выборочное среднее по строкам и столбцам

Оценкой является полная (общая) выборочная дисперсия

Слайд 35

Возможны и другие ситуации. Может оказаться, что один фактор значим, а

Возможны и другие ситуации. Может оказаться, что один фактор значим, а

другой не значим. В этом случае мы имеем дело или с m или k (в зависимости от того, какой фактор значим) генеральными совокупностями.
Слайд 36

Пример двухфакторного дисперсионного анализа

Пример двухфакторного дисперсионного анализа

Слайд 37

Исходные для примера получены с помощью программы «Модел. вероят. процессов.xls» при

Исходные для примера получены с помощью программы «Модел. вероят. процессов.xls» при

сочетании факторов, приведенных в ниже.
В примере Y – результирующий параметр, который регистрируется при проведении численных экспериментов, а х1 и х2 – факторы, влияние которых требуется исследовать.
Слайд 38

Необходимо провести девять партий экспериментов по 10 опытов в каждой партии.

Необходимо провести девять партий экспериментов по 10 опытов в каждой партии.

Исследование предусматривает испытания на трех уровнях первого фактора xn1 xср1,, xv1 (нижнем, среднем и верхнем) и трех уровнях второго фактора xn2 xср2,, xv2 (нижнего, среднего и верхнего)
В данном примере k=3, m=3, n=10.
Слайд 39

Условия проведения численных экспериментов

Условия проведения численных экспериментов

Слайд 40

Результаты численных экспериментов

Результаты численных экспериментов

Слайд 41

Средние значения в партиях (в скобках дисперсии S2)

Средние значения в партиях (в скобках дисперсии S2)

Слайд 42

Проверка однородности дисперсий по критерию Кохрена k=9 Гипотеза об однородности дисперсий

Проверка однородности дисперсий по критерию Кохрена



k=9

Гипотеза об однородности дисперсий

для разных партий опытов подтверждается, так как меньше табличного значения
Слайд 43

Расчет числа степеней свободы и дисперсий .

Расчет
числа
степеней
свободы
и дисперсий

.

Слайд 44

Проверка взаимодействия между факторами х1 и х2 Проверка гипотезы об отсутствии

Проверка взаимодействия между факторами х1 и х2

Проверка гипотезы об отсутствии взаимодействия

между исследуемыми факторами – вычисляем дисперсионное соотношение

При f1=81 и f2=4 F0,05= 5,634. Расчетное значение F существенно меньше табличного значения, что подтверждает гипотезу об отсутствии взаимодействия между исследуемыми факторами.

Принимаем по таблице


Слайд 45

Слайд 46

Проверяем значимость влияния обоих факторов на исследуемую величину Y. Вычисляем общую

Проверяем значимость влияния обоих факторов на исследуемую величину Y. Вычисляем общую

оценку дисперсий

Вычисляем дисперсионные соотношения

и

При f1=k -1=2 и f2=f3+f4= 85 F0,05=3,15, F1 и F2 на много больше табличных значений.
Из результатов расчета следует, что исследуемые факторы х1 и х2 оказывают сильное влияние на случайную величину Y.

Слайд 47

Так как влияние обоих факторов значимо, то мы имеем дело с

Так как влияние обоих факторов значимо, то мы имеем дело с

k*m = 9 нормально распределенными генеральными совокупностями с общей дисперсией и разными значениями
, оценками которых служат выборочная дисперсия S20 и выборочные средние для каждой комбинации факторов
Слайд 48

Определение параметров выборок Значения Z1 и Z2 находим по табл. при

Определение параметров выборок

Значения Z1 и Z2 находим по табл. при принятой

доверительной вероятности γ=0,95 и количестве наблюдений n=

.

Интервальные, оценки среднеквадратического отклонения и математического ожидания выборок определяют по формулам

Слайд 49

Таблица распределения Стьюдента

Таблица распределения Стьюдента

Слайд 50