Проверка гипотез: о равенстве вероятностей успеха в двух сериях опытов, о равенстве средних значений для двух выборок

Содержание

Слайд 2

Меня хорошо слышно и видно?

Меня хорошо слышно и видно?

Слайд 3

Александр Горяинов Кандидат физико-математических наук Доцент кафедры теории вероятностей и компьютерного моделирования Московского авиационного института Преподаватель

Александр Горяинов
Кандидат физико-математических наук
Доцент кафедры теории вероятностей и компьютерного моделирования Московского

авиационного института

Преподаватель

Слайд 4

Активно участвуем Задаем вопрос в чат или голосом Off-topic обсуждаем в

Активно участвуем
Задаем вопрос в чат или голосом
Off-topic обсуждаем в Slack #канал

группы или #general
Вопросы вижу в чате, могу ответить не сразу

Правила вебинара

Слайд 5

Занятие 25 Проверка гипотез A/B-тестирование Гипотеза о равенстве вероятностей успеха в

Занятие 25 Проверка гипотез A/B-тестирование

Гипотеза о равенстве вероятностей успеха в двух сериях

опытов
Гипотеза о равенстве средних значений для двух выборок (двухвыборочная задача о сдвиге)

Александр Горяинов

Слайд 6

После занятия вы будете знать: 1 как понять, является ли значимой

После занятия вы будете знать:

1

как понять, является ли значимой разница долей

2

как

понять, является ли значимой разница средних

Цели занятия

Слайд 7

A/B-тестирование A/B-тестирование – исследование, в котором части пользователей показывается один вариант

A/B-тестирование

A/B-тестирование – исследование, в котором части пользователей показывается один вариант какого-либо

сервиса, а части – другой, а затем выясняется, значимо ли отличается для этих двух групп пользователей какой-либо целевой показатель.
Обычно целевой показатель – это либо доля пользователей, совершивших какое-то действие (например, кликнувших на баннер или совершивших покупку), либо среднее значение чего-либо (например, среднее время, проведённое на сайте).
Слайд 8

Гипотеза о равенстве вероятностей «успеха» Проведено две серии опытов по схеме

Гипотеза о равенстве вероятностей «успеха»

Проведено две серии опытов по схеме Бернулли.


Вероятности «успеха» равны: в первой серии – p1,
во второй серии – p2.
Обе эти вероятности неизвестны.
Результаты эксперимента выглядят так:
Слайд 9

Формулировка гипотезы Физический смысл p1 и p2 при A/B-тестировании – доли

Формулировка гипотезы

Физический смысл p1 и p2 при A/B-тестировании – доли пользователей,

совершивших интересующее нас действие среди тех, кто использовал первый и второй вариант сервиса, соответственно.

Нужно проверить гипотезу
HO: p1 = p2 = p
против одной из альтернатив
HA: p1 > p2 либо HA: p1 < p2 либо HA: p1 ≠ p2

Слайд 10

Статистика критерия Для сравнения неизвестных нам вероятностей p1 и p2 будем

Статистика критерия

Для сравнения неизвестных нам вероятностей
p1 и p2 будем использовать

их оценки – частоты n11/n1. и n12/n2.

Если гипотеза HO верна, то T ~ N(0; 1).

Слайд 11

Доверительная и критическая области HA: p1 ≠ p2 HA: p1 > p2 HA: p1

Доверительная и критическая области

HA: p1 ≠ p2
HA: p1 > p2
HA:

p1 < p2
Слайд 12

Пример Проводилось A/B тестирование интерфейса интернет-магазина. Конверсия в покупку у варианта

Пример

Проводилось A/B тестирование интерфейса интернет-магазина. Конверсия в покупку у варианта А

– 4,2% при выборке в 1100 пользователей, у варианта B – 3% при выборке в 1000 пользователей. Определите, является ли преимущество варианта А значимым.
Слайд 13

Алгоритм проверки гипотезы 0. Строим математическую модель. 1. Формулируем основную и

Алгоритм проверки гипотезы

0. Строим математическую модель.
1. Формулируем основную и альтернативную гипотезы.
2.

Формулируем утверждение о статистике критерия.
Вычисляем значение статистики критерия.
4а. Строим доверительную и критическую области с помощью квантилей распределения из п. 2
5а. Принимаем решение: если статистика критерия попала в доверительную область, основная
гипотеза принимается, если в критическую –
отвергатся.
4б. Вычисляем Р-значение.
Слайд 14

Решение 0. Математическая модель p1 – вероятность попкупки при варианте А

Решение

0. Математическая модель
p1 – вероятность попкупки при варианте А
p2 – вероятность

попкупки при варианте В
Слайд 15

Решение 0. Математическая модель p1 – вероятность попкупки при варианте А

Решение

0. Математическая модель
p1 – вероятность попкупки при варианте А
p2 – вероятность

попкупки при варианте В

1. Гипотезы

HO: p1 = p2
HA: p1 > p2

Слайд 16

Решение 0. Математическая модель p1 – вероятность попкупки при варианте А

Решение

0. Математическая модель
p1 – вероятность попкупки при варианте А
p2 – вероятность

попкупки при варианте В

1. Гипотезы

HO: p1 = p2
HA: p1 > p2

2. Утверждение о статистике критерия
Если гипотеза HO верна, то T ~ N(0; 1)

Слайд 17

Решение Вычисляем значение статистики критерия.

Решение

Вычисляем значение статистики критерия.

Слайд 18

Решение 4а. Строим доверительную и критическую области u1 – α 1,65

Решение

4а. Строим доверительную и критическую области

u1 – α
1,65

=

Возьмём α =

0,05

T
1,46

=

Слайд 19

Решение 4а. Строим доверительную и критическую области 5а. Принимаем решение u1

Решение

4а. Строим доверительную и критическую области

5а. Принимаем решение

u1 – α
1,65

=

Статистика

критерия попала в доверительную область, следовательно гипотеза HO принимается

Возьмём α = 0,05

T
1,46

=

Слайд 20

Решение 4а. Строим доверительную и критическую области 5а. Принимаем решение u1

Решение

4а. Строим доверительную и критическую области

5а. Принимаем решение

u1 – α
1,65

=

Статистика

критерия попала в доверительную область, следовательно гипотеза HO принимается

4б. Вычисляем Р-значение.

Возьмём α = 0,05

T
1,46

=

Слайд 21

Задача о сдвиге Есть две выборки X1, …, Xm и Y1,

Задача о сдвиге

Есть две выборки X1, …, Xm и Y1, …,

Yn , представляющие собой результаты измерения одного и того же показателя для двух разных групп объектов. Нужно понять, является ли значимым различие средних значений этих выборок.
Слайд 22

Задача о сдвиге Есть две выборки X1, …, Xm и Y1,

Задача о сдвиге

Есть две выборки X1, …, Xm и Y1, …,

Yn , представляющие собой результаты измерения одного и того же показателя для двух разных групп объектов. Нужно понять, является ли значимым различие средних значений этих выборок.

Предполагается, что законы распределения Xi и Yj если и отличаются друг от друга, то только средними значениями (могут быть сдвинуты одно относительно другого):
X1, …, Xm ~ F(x)
Y1, …, Yn ~ F(x+θ)
θ – то, насколько измеряемый показатель для второй выборки больше, чем для первой.

Слайд 23

Формулировка гипотезы Нужно проверить гипотезу HO: θ = 0 (сдвига нет,

Формулировка гипотезы

Нужно проверить гипотезу
HO: θ = 0 (сдвига нет, различие средних

значений незначимо)
против одной из альтернатив
HA: θ > 0 (среднее для второй выборки значимо больше, чем для первой)
либо
HA: θ < 0 (среднее для второй выборки значимо меньше, чем для первой)
либо
HA: θ ≠ 0 (средние значения значимо различаются)
Слайд 24

Критерий Вилкоксона (Манна-Уитни) Элементы объединённой выборки из Xi и Yj упорядочиваются

Критерий Вилкоксона (Манна-Уитни)

Элементы объединённой выборки из Xi и Yj упорядочиваются по

возрастанию и нумеруются. Эта процедура называется ранжированием, а получающиеся номера – рангами.
Ri – ранг Yi в объединённой выборке.
Слайд 25

Критерий Вилкоксона (Манна-Уитни) Элементы объединённой выборки из Xi и Yj упорядочиваются

Критерий Вилкоксона (Манна-Уитни)

Элементы объединённой выборки из Xi и Yj упорядочиваются по

возрастанию и нумеруются. Эта процедура называется ранжированием, а получающиеся номера – рангами.
Ri – ранг Yi в объединённой выборке.
Слайд 26

Критерий Вилкоксона (Манна-Уитни) Элементы объединённой выборки из Xi и Yj упорядочиваются

Критерий Вилкоксона (Манна-Уитни)

Элементы объединённой выборки из Xi и Yj упорядочиваются по

возрастанию и нумеруются. Эта процедура называется ранжированием, а получающиеся номера – рангами.
Ri – ранг Yi в объединённой выборке.
Слайд 27

Доверительная и критическая области HA: θ ≠ 0 HA: θ > 0 HA: θ

Доверительная и критическая области

HA: θ ≠ 0
HA: θ > 0


HA: θ < 0
Слайд 28

Пример Проводилось A/B тестирование страницы онлайн-табло аэропорта. Договорились, что лучшим будет

Пример

Проводилось A/B тестирование страницы онлайн-табло аэропорта. Договорились, что лучшим будет считаться

вариант, при котором человек быстрее находит нужный рейс и проводит на странице меньше времени.
10 человек, которые попали на вариант А, провели на странице: 30, 28, 46, 42, 35, 33, 44, 43, 31, 38 секунд.
8 человек, которые попали на вариант B, провели на странице: 26, 38, 39, 28, 30, 27, 32, 35 секунд.
Можно ли считать, что вариант B значимо лучше варианта А?
Слайд 29

Алгоритм проверки гипотезы 0. Строим математическую модель. 1. Формулируем основную и

Алгоритм проверки гипотезы

0. Строим математическую модель.
1. Формулируем основную и альтернативную гипотезы.
2.

Формулируем утверждение о статистике критерия.
Вычисляем значение статистики критерия.
4а. Строим доверительную и критическую области с помощью квантилей распределения из п. 2
5а. Принимаем решение: если статистика критерия попала в доверительную область, основная
гипотеза принимается, если в критическую –
отвергатся.
4б. Вычисляем Р-значение.
Слайд 30

Решение 0. Математическая модель X1, …, Xm ~ F(x) – время

Решение

0. Математическая модель
X1, …, Xm ~ F(x) – время у пользователей

с интерфейсом А
Y1, …, Yn ~ F(x+θ) – время у пользователей с интерфейсом В
Слайд 31

Решение 0. Математическая модель X1, …, Xm ~ F(x) – время

Решение

0. Математическая модель
X1, …, Xm ~ F(x) – время у пользователей

с интерфейсом А
Y1, …, Yn ~ F(x+θ) – время у пользователей с интерфейсом В

1. Гипотезы

HO: θ = 0
HA: θ < 0

Слайд 32

Решение 0. Математическая модель X1, …, Xm ~ F(x) – время

Решение

0. Математическая модель
X1, …, Xm ~ F(x) – время у пользователей

с интерфейсом А
Y1, …, Yn ~ F(x+θ) – время у пользователей с интерфейсом В

1. Гипотезы

HO: θ = 0
HA: θ < 0

2. Утверждение о статистике критерия
Если гипотеза HO верна, то ~ N(0; 1)

Слайд 33

Решение Вычисляем значение статистики критерия. 30, 28, 46, 42, 35, 33,

Решение

Вычисляем значение статистики критерия.
30, 28, 46, 42, 35, 33, 44, 43,

31, 38
26, 37, 39, 28, 31, 27, 32, 35
Слайд 34

Решение Вычисляем значение статистики критерия. 30, 28, 46, 42, 35, 33,

Решение

Вычисляем значение статистики критерия.
30, 28, 46, 42, 35, 33, 44, 43,

31, 38
26, 37, 39, 28, 31, 27, 32, 35

5; 3,5; 18; 15; 10,5; 9; 17; 16; 6,5; 13
1; 12; 14; 3,5; 6,5; 2; 8; 10,5

Слайд 35

Решение Вычисляем значение статистики критерия. 30, 28, 46, 42, 35, 33,

Решение

Вычисляем значение статистики критерия.
30, 28, 46, 42, 35, 33, 44, 43,

31, 38
26, 37, 39, 28, 31, 27, 32, 35

5; 3,5; 18; 15; 10,5; 9; 17; 16; 6,5; 13
1; 12; 14; 3,5; 6,5; 2; 8; 10,5

W = 1 + 12 + 14 + 3,5 + 6,5 + 2 + 8 + 10,5 = 57,5
M[W] = 8/2 (10 + 8 +1) = 76
D[W] = 8*10/12 (10 + 8 +1) = 126,67

Слайд 36

Решение 4а. Строим доверительную и критическую области uα –1,65 = –1,69 = Возьмём α = 0,05

Решение

4а. Строим доверительную и критическую области


–1,65

=

–1,69

=

Возьмём α = 0,05

Слайд 37

Решение 4а. Строим доверительную и критическую области 5а. Принимаем решение uα

Решение

4а. Строим доверительную и критическую области

5а. Принимаем решение


–1,65

=

–1,69

=

Статистика критерия попала

в критическую область, следовательно гипотеза HO отвергается в пользу HA

Возьмём α = 0,05

Слайд 38

Решение 4а. Строим доверительную и критическую области 5а. Принимаем решение uα

Решение

4а. Строим доверительную и критическую области

5а. Принимаем решение


–1,65

=

–1,69

=

Статистика критерия попала

в критическую область, следовательно гипотеза HO отвергается в пользу HA

4б. Вычисляем Р-значение.

Возьмём α = 0,05

Слайд 39

2 Пройти тест по теме «Проверка гипотез» 1 Реализовать на любом

2

Пройти тест по теме «Проверка гипотез»

1

Реализовать на любом языке программирования критерии

проверки гипотез о равенстве долей и равенстве средних

Срок – 20:00 07.11.2019

Домашнее задание

3

Решить с помощью созданной программы несколько задач

Слайд 40

Пятница 8.11.2019 в 19:00 Ссылка на вебинар будет в ЛК за

Пятница 8.11.2019 в 19:00

Ссылка на вебинар будет в ЛК за 15

минут

Тема: Исследование зависимостей пар признаков

8.11

Следующий вебинар

Слайд 41

Заполните, пожалуйста, опрос о занятии

Заполните, пожалуйста, опрос о занятии