- Главная
- Математика
- Проверка статистических гипотез (лекция 8)
Содержание
- 2. Определения Статистическая гипотеза – это предположение о каком-то свойстве генеральной совокупности Например, что mx генеральной совокупности
- 3. Пример статистики Рассмотрим выборку с параметрами xср, Sx (СКО) Допустим, что mx = 12. Нулевая гипотеза
- 4. Доверительная область Доверительная область (доверительный интервал) - область принятия гипотезы Доверительная вероятность (рд) – вероятность получения
- 5. Уровень значимости Вероятность попадания t* в критическую область равна α = 1 - рд. Здесь α
- 6. Уровень значимости (α) и доверительная вероятность для различных альтернативных гипотез
- 7. Критерии, используемые для проверки однородности гидрологических рядов Используются критерии двух типов: параметрические и непараметрические В параметрических
- 8. Критерии Стьюдента для проверки значимости различных средних значений двух выборок Допустим, что (х1, х2, х2 ….хn)
- 9. Критерии Стьюдента для проверки значимости различных средних значений двух выборок (2) В окончательном виде выражение для
- 10. Критерий равенства двух дисперсий Если (х1, х2, х2 ….хn) и (у1, у2, у ….уn) – выборки
- 11. Расчет по критерию Фишера Исходный ряд делится на две части Оцениваются дисперсии для каждой из частей
- 12. Рангово – суммарные критерии Вилкоксона, Вилкоксона - Манна - Уитни Критерии используются для проверки нулевой гипотезы
- 13. Критерий Вилкоксона Статистика Вилкоксона. Пусть даны две выборки из совокупностей X и Y длиной m и
- 14. Критерий Вилкоксона Если расчет выполнен правильно, то должно выполняться равенство ω1 + ω2.= N(N+1)/2 где N
- 15. Статистика Вилкоксона - Манна - Уитни (U – статистика) Для определения U вычислим: U1 = m•n
- 16. Статистика Вилкоксона - Манна - Уитни (U – статистика) При m ≥ 8 и n ≥
- 18. Скачать презентацию
Определения
Статистическая гипотеза – это предположение о каком-то свойстве генеральной совокупности
Например,
Определения
Статистическая гипотеза – это предположение о каком-то свойстве генеральной совокупности
Например,
Нулевая гипотеза – это когда предполагается, что среднее значение выборки x1, x2, x3….xn (если n большое) мало отличаться от mx генеральной совокупности
Альтернативная гипотеза Н1 – это когда предполагается, что mx ≠ хср, mx > хср, mx < хср
Критерий (тест) статистической гипотезы - это правило, позволяющее принять или отвергнуть гипотезу
Статистики – это определенные функции g (x1, x2, x3….xn), используемые для выполнения теста
Пример статистики
Рассмотрим выборку с параметрами xср, Sx (СКО)
Допустим, что
Пример статистики
Рассмотрим выборку с параметрами xср, Sx (СКО)
Допустим, что
Нулевая гипотеза (Н0). Разница (xср - mx) достаточно мала
Эту разницу можно рассматривать в качестве анализируемой статистики
Но на практике используют другую статистику t = (xср - mx)/(Sx/√n), так как соответствие с теоремой 2 прошлой лекции заранее известно, что это выражение подчиняется распределению Стьюдента
На использовании этой статистики базируется критерий Стьюдента, который можно использовать для проверки нулевой гипотезы
С этой целью для конкретной реализации рассчитывают эмпирическое значение статистики Стьюдента t*. Например, n=36, xср =11, Sx = 5, t* = 1.2.
Величина t* является СВ и для выборок различной длины значение t* будет различным
Область возможных значений (ОВЗ) этой статистики - вся числовая ось
ОВЗ делиться на две области:
- область принятия гипотезы
критическая область
Если t* попадает в область принятия гипотезы, то Н0 не опровергается, если в критическую область, то Н0 опровергается.
Доверительная область
Доверительная область (доверительный интервал) - область принятия гипотезы
Доверительная область
Доверительная область (доверительный интервал) - область принятия гипотезы
Геометрически эта вероятность показана (заштрихована) на рисунке
Область принятия гипотезы [A,B]
и критическая область: (-∞, А) + (В, + ∞)
Уровень значимости
Вероятность попадания t* в критическую область равна α =
Уровень значимости
Вероятность попадания t* в критическую область равна α =
Если критическая область состоит из двух частей, то вместо α пишут 2α = 1 - рд , где 2α указывает на то, что уровень значимости двухсторонний
В гидрологической практике наиболее часто используют уровни значимости 5 и 10%
К примеру, если принять уровень значимости 2α = 10% то, используя таблицу распределения Стьюдента при ν = n – 1 = 35, получим теоретическое значение t – статистики равное 1,69. Это означает, что доверительная область представлена отрезком [-1,69, + 1,69]
Если t* = - 1,20 (по фактическим данным), значить t* попадает в доверительную область, первоначальная нулевая гипотеза не опровергается, то есть можно считать, что разница между mx и xср является статистически не значимой
Хотя в данном случае речь идет о конкретном критерии (Стьюдента), основные принципы проверки нулевой гипотезы сохраняются и при использовании других критериев.
Уровень значимости (α) и доверительная
вероятность для различных альтернативных гипотез
Уровень значимости (α) и доверительная
вероятность для различных альтернативных гипотез
Критерии, используемые
для проверки однородности гидрологических рядов
Используются критерии двух
Критерии, используемые
для проверки однородности гидрологических рядов
Используются критерии двух
В параметрических критериях используются выборочные оценки параметров распределения (критерии Стьюдента и Фишера). При этом считается, что выборка относится к генеральной совокупности с известным законом распределения (обычно с нормальным законом)
Непараметрические критерии основываются на использовании непараметрических статистик. Статистика g (x1, x2, x3….xn), является непараметрической, если ее распределение не зависит от распределения Х
Критерии Стьюдента для проверки
значимости различных средних значений двух выборок
Допустим, что
Критерии Стьюдента для проверки
значимости различных средних значений двух выборок
Допустим, что
Если выборки относятся к одной генеральной совокупности, то разность должна быть близка к нулю. На основе этой разности строиться статистика
t = (xср - уср)/(σxср - уср)
где σxср - уср – СКО разности (xср - уср). Как следует из теоремы 2, из предыдущей лекции эта статистика подчиняется распределению Стьюдента при ν = (m + n – 2).
В математической статистике доказано, что
где S – эмпирическая оценка σxср - уср. Значение S определяется в зависимости от выборочных значений Sх и Sу.
Критерии Стьюдента для проверки
значимости различных средних значений двух выборок (2)
В окончательном
Критерии Стьюдента для проверки
значимости различных средних значений двух выборок (2)
В окончательном
В практике гидрологических расчетов эта статистика используется для проверки однородности рядов по среднему значению
Исходный ряд делится на две части (две выборки) Если дата возможного нарушения стока неизвестна, то ряд делится пополам.
Уровень значимости обычно принимается 2α = 5% или 2α = 10%
Критерий Стьюдента рекомендуется в большинстве нормативных документов в качестве одного из официальных тестов на однородность.
При использовании критерия Стьюдента нужно учитывать три момента:
предполагается, что анализируемые выборки относятся к нормальным совокупностям
предполагается, что анализируемые выборки имеют одинаковую (хотя и неизвестную) дисперсию, поэтому перед использованием критерия Стьюдента следует проверить ряд на однородность по дисперсии
В классической статистике длина выборок предполагается значительной большей, чем та, которую мы имеем на практике
Критерий равенства двух дисперсий
Если (х1, х2, х2 ….хn) и (у1,
Критерий равенства двух дисперсий
Если (х1, х2, х2 ….хn) и (у1,
Следовательно, при нулевой гипотезе H0 (т.е. при предположении о том, что Sx2 = Sy2) и при уровне значимости 2α доверительная значимость для отношения Sx2/Sy2 определяется выражением
Fα (ν1, ν2,) ≤ (Sx2/Sy2) < F1- α (ν1, ν2) или 1/F1- α ≤ (Sx2/Sy2) < F1- α
Распределение Фишера является несимметричным и для того, чтобы сократить объем таблиц, их составляют только для F > 1, а при сравнении Sx2 и Sy2 в числитель всегда подставляют большую дисперсию. В этом случае доверительная область при уровне значимости 2α определяется выражением
1 ≤ (Sx2/Sy2) < F1- α
Этот критерий используется для проверки однородности гидрологических рядов по дисперсии.
Расчет по критерию Фишера
Исходный ряд делится на две части
Оцениваются
Расчет по критерию Фишера
Исходный ряд делится на две части
Оцениваются
Полученное значение F* сравниваются с табличным значением F1- α.
Если при принятом уровне значимости оказывается, что F*< F1- α, то расхождение дисперсий считается незначимым и гипотеза об однородности ряда по дисперсии не опровергается
Критерий Фишера (также как и критерий Стьюдента) относится к категории стандартных критериев и рекомендуется в большинстве нормативных документов в качестве официального теста на однородность.
Рангово – суммарные
критерии Вилкоксона, Вилкоксона - Манна - Уитни
Критерии
Рангово – суммарные
критерии Вилкоксона, Вилкоксона - Манна - Уитни
Критерии
Критерии Вилкоксона и Манна – Уитни относятся к категории непараметрических критериев и не подразумевают непосредственного расчета выборочных параметров функции распределения
Достоинством критериев является то, что они не требуют обязательной принадлежности выборок к нормальной совокупности
Критерий Вилкоксона
Статистика Вилкоксона. Пусть даны две выборки из совокупностей X
Критерий Вилкоксона
Статистика Вилкоксона. Пусть даны две выборки из совокупностей X
Каждому значению нового ряда присвоим порядковый номер (ранг). Выпишем значения подученных рангов отдельно для каждой из выборок (таблица ниже) и вычислим ранговые суммы ω1 и ω2
Критерий Вилкоксона
Если расчет выполнен правильно, то должно выполняться равенство
ω1 + ω2.=
Критерий Вилкоксона
Если расчет выполнен правильно, то должно выполняться равенство
ω1 + ω2.=
где N = m + n
В качестве анализируемой статистики ω* рассматривается выборка
ω* = r1 + r2 + r3 + + rm
где ri - ранг хi
Для статистики Вилкоксона разработаны таблицы, позволяющие определить доверительный интервал для ω (в зависимости от m, n и уровня значимости 2α). Найденное значение ω сравнивается с математическим ожиданием статистики M(W), которое вычисляется по формуле M(W) = (m+n+1)/2
wB(α, n1,n2) > w и wН(α, n1,n2) < w
Верхнее критическое значение связано с нижним соотношением
wB(α, n1,n2) = 2 M(W) - wН(α, n1,n2)
Однако в настоящее время более широкое распространение получила статистика, предложенная Манном и Уитни, так называемая U – статистика.
Статистика Вилкоксона - Манна - Уитни (U – статистика)
Для определения U
Статистика Вилкоксона - Манна - Уитни (U – статистика)
Для определения U
U1 = m•n + m(m + 1)/2 - ω1
U2 = m•n + m(m + 1)/2 - ω2
В качестве анализируемой статистики U* можно использовать любое из полученных значений (U1 и U2). Обычно в качестве U* принимается меньшее значение. При правильном расчете должно выполняться равенство
U1 + U2 = m•n
Распределение U – статистики Манна – Уитни является симметричным с МО и дисперсией
mU = (m•n)/2
DU = σ2U = m•n(m+n+1)/12
Статистика Вилкоксона - Манна - Уитни (U – статистика)
При m
Статистика Вилкоксона - Манна - Уитни (U – статистика)
При m
mU – t1- α σU ≤ U < mU + t1- α σU
где t1- α - квантиль стандартного нормального распределения;
mU и σU – параметры, определяемые по формулам
mU = (m•n)/2
DU = σ2U = m•n(m+n+1)/12
Критерий Уилкоксона – Манна – Уитни можно использовать для проверки однородности гидрологических рядов. В этом случае исходный ряд разбивается на две выборки, длиной m и n.