Сравнение двух выборок

Содержание

Слайд 2

5.1. Гипотеза о равенстве средних. Независимые выборки

5.1. Гипотеза о равенстве средних. Независимые выборки


Слайд 3

Пример Представьте себе, что вы — региональный менеджер по продажам компании

Пример

Представьте себе, что вы — региональный менеджер по продажам компании BLK

Foods и
хотите сравнить объемы продаж BLK-колы, выставленной на обычных полках и на
специализированных стелла­жах. Для этого вы создаете выборку, состоящую из 30 магазинов
компании BLK Foods, в которых объявлена полная распро­дажа товаров. Затем вы случайным
образом делите эту выборку пополам: 15 магазинов относите к первой группе, а остальные 15
— ко второй. Менеджеры магазинов из первой группы размещают бутылки с BLK-колой на
обычных полках среди других прохладительных напитков. В то же время менеджеры магазинов
из второй группы должны расположить бутылки с BLK-колой на специализированных стеллажах
и разместить на них рекламу. Как определить, одинаковы ли объемы продаж BLK-колы в
магазинах из этих двух групп?
Слайд 4

Независимые выборки. Описание проблемы Что мы имеем 1. Две случайные выборки,

Независимые выборки. Описание проблемы

Что мы имеем
1. Две случайные выборки, полученные из

двух генеральных совокупностей
2. Выборки являются независимыми. Это значит, что между субъектами в каждой из выборок нет связи.
3. Выборки извлечены из нормальной генеральной совокупности. Если объем каждой выборки больше 30, то это требование не обязательно.
Что мы хотим
Проверить гипотезу о равенстве средних двух генеральных совокупностей:
Слайд 5

Гипотеза Нулевая гипотеза: Альтернативная гипотеза:

Гипотеза

Нулевая гипотеза:
Альтернативная гипотеза:

Слайд 6

Односторонние гипотезы Нулевая гипотеза: Альтернативная гипотеза:

Односторонние гипотезы

Нулевая гипотеза:
Альтернативная гипотеза:

Слайд 7

Критерий Стьюдента для проверки равенства средних. Статистика Для проверки гипотезы используется

Критерий Стьюдента для проверки равенства средних. Статистика

Для проверки гипотезы используется

статистика:
где - выборочные средние
- объединенная дисперсия двух выборок
- объемы выборок

- степени свободы

Слайд 8

Последовательность действий Шаг 1. Сформулировать основную и альтернативную гипотезы. Шаг 2.

Последовательность действий

Шаг 1. Сформулировать основную и альтернативную гипотезы.
Шаг 2. По выборке

сосчитать значение статистики.
Шаг 3. Задать уровень значимости α.
Шаг 4. По таблице найти критические значения и построить критическую область.
Шаг 5. Сравнить полученное значение с критической областью. Если значение попало в критическую область – отклонить основную гипотезу, не попало – принять.
Шаг 6. Написать ответ.
Слайд 9

142 домохозяйства 151 домохозяйство Пример По данным выборочного обследования домохозяйств необходимо

142 домохозяйства

151 домохозяйство

Пример По данным выборочного обследования домохозяйств необходимо определить существенно

ли различается среднедушевой доход домохозяйств в Волгоградской и Саратовской областях
Слайд 10

Шаг 1. Сформулировать основную и альтернативную гипотезы. Среднедушевой доход в Саратовской

Шаг 1. Сформулировать основную и альтернативную гипотезы.

Среднедушевой доход в Саратовской и

Волгоградской областях одинаков

Среднедушевой доход в Саратовской и Волгоградской областях отличается

Слайд 11

1. Вычисляем выборочные средние (СРЗНАЧ) Средний среднедушевой доход в Волгоградской области

1. Вычисляем выборочные средние (СРЗНАЧ)

Средний среднедушевой доход в Волгоградской области

Средний среднедушевой

доход в Саратовской области

2. Вычисляем выборочные дисперсии (ДИСП)

Выборочная дисперсия в Волгоградской области

Выборочная дисперсия в Саратовской области

Шаг 2. По выборке сосчитать значение статистики.

Слайд 12

3. Вычисляем общую выборочную дисперсию по формуле 4. Вычисляем t-статистику по формуле

3. Вычисляем общую выборочную дисперсию по формуле

4. Вычисляем t-статистику по формуле

Слайд 13

Шаг 3. Задать уровень значимости α. (вероятность того, что мы ошибемся, отвергая ) . Пусть

Шаг 3. Задать уровень значимости α. (вероятность того, что мы ошибемся,

отвергая )
.

Пусть

Слайд 14

Шаг 4. По таблице найти критические значения и построить критическую область.

Шаг 4. По таблице найти критические значения и построить
критическую область.

Критерий

двусторонний.
= СТЬЮДРАСПОБР(0,05;151+142-2)

1,97

-1,97

-1,15

Слайд 15

Вывод: Нет оснований отвергать основную гипотезу. Среднедушевой доход в Саратовской и Волгоградской областях одинаков

Вывод: Нет оснований отвергать основную гипотезу. Среднедушевой доход в Саратовской и

Волгоградской областях одинаков
Слайд 16

5.2. Гипотеза о равенстве средних. Парные выборки

5.2. Гипотеза о равенстве средних. Парные выборки


Слайд 17

Пример Предположим, что некая компания разрабатывает новое программное обеспечение для финансовых

Пример

Предположим, что некая компания разрабатывает новое программное
обеспечение для финансовых расчетов.

Поскольку одним из основных критериев
качества программного обеспечения является скорость вычислений, разработчики
стремятся к тому, чтобы их пакет не уступал по своим возможностям лидерам рынка
программ, но превосходил их по скорости расчетов. Если новый пакет окажется
эффективным, он будет приводить к тем же результатам, что и другие программы, но
за более короткое время.
Для оценки программного обеспечения разработчики провели эксперимент, в ходе
которого один и тот же набор задач решали как с помощью стандартных программ,
так и с помощью нового пакета. Поскольку измерения для каждой конкретной задачи
проводились согласованно, для оценки эффективности пакета необходимо сравнить
не средние значения двух независимых выборок, а среднюю разность между
соответствующими элементами.
Слайд 18

Парные выборки. Описание проблемы Что мы имеем 1. Две случайные выборки,

Парные выборки. Описание проблемы

Что мы имеем
1. Две случайные выборки, полученные из

двух генеральных совокупностей
2. Выборки являются парными (зависимыми)
3. Обе выборки взяты из нормально распределенных генеральных совокупностей. Если объем каждой выборки больше 30, то это требование не обязательно.
Что мы хотим
Проверить гипотезу о разности средних двух генеральных совокупностей:
Слайд 19

Статистика для парных выборок Для проверки гипотезы используется статистика: где -

Статистика для парных выборок

Для проверки гипотезы используется статистика:
где
- разность между двумя

значениями x – y в одной паре
- среднее для парных разностей для выборки
- стандартное отклонение разностей для выборки
- количество пар
Слайд 20

Пример. Тренинг студентов Группа из 15 студентов прошла тест до тренинга

Пример. Тренинг студентов

Группа из 15 студентов прошла тест до тренинга и

после. Результаты теста в таблице. Проверим гипотезу для парных выборок на отсутствие влияния тренинга на подготовку студентов на уровне значимости 0,05.
Решение. Подсчитаем разности и их квадраты.
Слайд 21

Решение Шаг 1. Основная и альтернативная гипотезы: результаты теста выше результаты

Решение

Шаг 1. Основная и альтернативная гипотезы:

результаты теста выше

результаты теста не лучше,

чем
были до тренинга
Слайд 22

Решение Шаг 2. По выборке сосчитаем значение статистики. Можно использовать функцию ДИСП

Решение
Шаг 2. По выборке сосчитаем значение статистики.

Можно использовать функцию ДИСП

Слайд 23

Решение Статистика принимает значение: Среднее значение разностей получено делением 21 на 15 и равно 1,4.

Решение

Статистика принимает значение:
Среднее значение разностей получено делением 21 на 15 и

равно 1,4.
Слайд 24

Решение Шаг 3. Задан уровень значимости α=0,05. Шаг 4. По таблице

Решение

Шаг 3. Задан уровень значимости α=0,05.
Шаг 4. По таблице или в

Excel для степеней свободы df = 15 – 1=14 находим критическое значение t = 1,76 и строим критическую область:
=СТЬЮДРАСПОБР(0,1;14)
Слайд 25

Решение Шаг 5. Сравним полученное значение с критической областью. Полученное значение

Решение

Шаг 5. Сравним полученное значение с критической областью.
Полученное значение

статистики попало в критическую область.
Шаг 6. Формулируем вывод.
Нулевая гипотеза отвергается. Это означает, что влияние тренинга значимо на уровне значимости 0,05.
Слайд 26

5.3. Гипотеза о равенстве долей

5.3. Гипотеза о равенстве долей


Слайд 27

Пример На одном из островов компании Т. С, Resort Properties принадлежат

Пример

На одном из островов компании Т. С, Resort Properties принадлежат два

отеля: Beachcomer и Windsurfer. На вопрос “Планируете ли вы вернуться в наш отель снова?” 163 из 227 постояльцев отеля Beachcomer ответили: “Да”, в то же время 154 из 262 постояльцев отеля Windsurfer на этот вопрос ответили: “Нет”. Можно ли утверждать, что при уровне значимости, равном 0,05, между степенью удовлетворенности постояльцев обоих отелей (вероятностью, что в следующем сезоне они вернутся в отель) значимой разницы нет?
Слайд 28

Гипотезы Требуется проверить предположение о равенстве долей в двух генеральных совокупностях. Нулевая гипотеза: Альтернативная гипотеза: I

Гипотезы

Требуется проверить предположение о равенстве долей в двух генеральных совокупностях.


Нулевая гипотеза:

Альтернативная
гипотеза:

I

Слайд 29

Гипотезы Требуется проверить превышает ли доля успехов в одной группе долю

Гипотезы

Требуется проверить превышает ли доля успехов в одной группе долю успехов

в другой

II

III

Нулевая гипотеза:

Нулевая гипотеза:

Альтернативная
гипотеза:

Альтернативная
гипотеза:

Слайд 30

Обозначения - объемы выборок - количество «успехов» в каждой выборке -

Обозначения

- объемы выборок

- количество «успехов» в каждой выборке

- доля «успехов» в

первой выборке

- доля «успехов» во второй выборке

- общая доля «успехов» в обеих выборках

Слайд 31

Статистика В качестве статистики выбираем следующую случайную функцию: Статистика z имеет

Статистика

В качестве статистики выбираем следующую случайную функцию:
Статистика z имеет нормальное

распределение, поэтому для проверки гипотезы пользуемся таблицей нормального распределения или функцией Excel НОРМСТОБР.
Слайд 32

Пример На одном из островов компании Т. С, Resort Properties принадлежат

Пример

На одном из островов компании Т. С, Resort Properties принадлежат два

отеля: Beachcomer и Windsurfer. На вопрос “Планируете ли вы вернуться в наш отель снова?” 163 из 227 постояльцев отеля Beachcomer ответили: “Да”, в то же время 154 из 262 постояльцев отеля Windsurfer на этот вопрос ответили: “Да”. Можно ли утверждать, что при уровне значимости, равном 0,05, между степенью удовлетворенности постояльцев обоих отелей (вероятностью, что в следующем сезоне они вернутся в отель) значимой разницы нет?
Слайд 33

Решение Вычислим необходимые значения:

Решение

Вычислим необходимые значения:

Слайд 34

Решение Шаг 1. Основная и альтернативная гипотезы: Шаг 2. По выборке сосчитаем значение статистики.

Решение

Шаг 1. Основная и альтернативная гипотезы:
Шаг 2. По выборке сосчитаем значение

статистики.
Слайд 35

Решение Шаг 3. Задан уровень значимости α=0,05. Шаг 4. По таблице

Решение

Шаг 3. Задан уровень значимости α=0,05.
Шаг 4. По таблице нормального распределения

находим критические значения z = - 1,96 и z = 1,96 строим критическую область:

=НОРМСТОБР(1- 0,05/2)