Statistika_zanyatie_6

Содержание

Слайд 2

Таблица значений F-распределения

Таблица значений F-распределения

Слайд 3

Слайд 4

Слайд 5

Слайд 6

Таблица значений коэффициентов корреляции Пирсона

Таблица значений коэффициентов корреляции Пирсона

Слайд 7

Проверка гипотез о равенстве дисперсий для нескольких выборок. Критерии Бартлетта и Кохрена

Проверка гипотез о равенстве дисперсий для нескольких выборок. Критерии Бартлетта и Кохрена

 

Слайд 8

 

Слайд 9

 

Слайд 10

 

Слайд 11

Примеры По четырем независимым выборкам объемами n1 = 17, n2 =

Примеры

По четырем независимым выборкам объемами n1 = 17, n2 = 20,

n3 = 15, n4 = 16, извлеченными из нормально распределенных генеральных совокупностей, найдены исправленные выборочные дисперсии s12 = 2,5, s22 = 3,6, s32 = 4,1, s42 = 5,8. При уровне значимости 0,05 1) проверить нулевую гипотезу о равенстве дисперсий; 2) если эта гипотеза принимается, оценить генеральную дисперсию.
V= 2,798 < 7,81 => нулевая гипотеза принимается
Генеральная дисперсия 3,95
Слайд 12

Примеры По четырем независимым выборкам объема n = 17, извлеченными из

Примеры

По четырем независимым выборкам объема n = 17, извлеченными из нормально

распределенных генеральных совокупностей, найдены исправленные выборочные дисперсии s12 = 0,21, s22 = 0,25, s32 = 0,34, s42 = 0,4. При уровне значимости 0,05 1) проверить нулевую гипотезу о равенстве дисперсий; 2) если эта гипотеза принимается, оценить генеральную дисперсию.
G < Gкр => нулевая гипотеза принимается
Оценка генеральной дисперсии – 0,3.
Слайд 13

Примеры 11. По трем независимым выборкам, объемы которых п1 = 9,

Примеры

11. По трем независимым выборкам, объемы которых п1 = 9, п2

= 13, п3 = 15, извлеченным из нормальных генеральных совокупно­стей, найдены исправленные выборочные дисперсии, равные 3,2; 3,8; 6,3 соответственно. Требуется: а) на уровне значимости 0,05 проверить гипотезу о равенстве дисперсий; б) оценить ге­неральную дисперсию.
12. Аудиторы компании интересуются системой обработки счетов доходов. Они взяли случайную выборку из 100 законченных счетов, в которой 8 счетов оказались дефектными. Тогда ау­диторы предложили некоторые модификации в процедуре и через определенное время провели случайную выборку из 150 завершенных счетов, где обнаружили 6 дефектных счетов. Имеется ли основание предполагать на уровне значимости 5%, что новые процедуры уменьшают ошибку
Слайд 14

Регрессионный и корреляционный анализ

Регрессионный и корреляционный анализ

Слайд 15

Статистической зависимостью называется такая зависимость, при которой изменение одной из величин

Статистической зависимостью называется такая зависимость, при которой изменение одной из величин

влечет за собой изменение распределения другой.
Если при изменении одной из величин изменяется среднее значение другой, то в этом случае статистическая зависимость является корреляционной.
Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.
Зависимость между Х и условным математическим ожиданием Y называется регрессионной зависимостью.
Слайд 16

Задача корреляционного анализа - установить, являются ли данные случайные величины взаимосвязанными.

Задача корреляционного анализа - установить, являются ли данные случайные величины взаимосвязанными.


Задача регрессионного анализа - описать эту связь аналитической зависимостью, т.е. с помощью уравнения.
Слайд 17

Коэффициенты корреляции 1. Для порядковых данных используются следующие коэффициенты корреляции: •

Коэффициенты корреляции

1. Для порядковых данных используются следующие коэффициенты корреляции:
• ρ -

коэффициент ранговой корреляции Спирмена
• τ - коэффициент ранговой корреляции Кендалла
2. Для переменных с интервальной и номинальной шкалой используется коэффициент корреляции Пирсона (корреляция моментов произведений).
3. Если, по меньшей мере, одна из двух переменных имеет порядковую шкалу, либо не является нормально распределённой, используется ранговая корреляция Спирмена или τ-Кендалла.
Применение коэффициента Кендалла предпочтительно, если в исходных данных имеются выбросы.
Слайд 18

Коэффициент ранговой корреляции Спирмена Допустим, что объекты генеральной совокупно­сти обладают двумя

Коэффициент ранговой корреляции Спирмена
Допустим, что объекты генеральной совокупно­сти обладают двумя качественными

признаками. Под ка­чественным подразумевается признак, который невозмож­но измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их в порядке убывания или возрастания качества. Пусть выборка объема п содержит независимые объ­екты, которые обладают двумя качественными признака­ми А и Б. Для оценки степени связи признаков используют коэффициенты ранговой корреляции.
Для практических целей использование ранговой кор­реляции весьма полезно. Например, если установлена высокая ранговая корреляция между двумя качествен­ными признаками изделий, то достаточно контролировать изделия только по одному из признаков, что удешевляет и ускоряет контроль
Слайд 19

 

Слайд 20

 

Слайд 21

Преимущество коэффициента корреляции рангов Спирмена состоит в том, что ранжировать можно

Преимущество коэффициента корреляции рангов Спирмена состоит в том, что ранжировать можно

и по таким признакам, которые нельзя выразить численно.
При экспертных оценках можно ранжировать оценки разных экспертов и найти их корреляции друг с другом, чтобы затем исключить из рассмотрения оценки эксперта, слабо коррелированные с оценками других экспертов.
Коэффициент корреляции рангов Спирмена применяется для оценки устойчивости тенденции динамики.
Слайд 22

Недостатки: одинаковым разностям рангов могут соответствовать совершенно отличные разности значений признаков

Недостатки:
одинаковым разностям рангов могут соответствовать совершенно отличные разности значений признаков (в

случае количественных признаков);
характер распределения коррелируемых величин не имеет значения;
число варьирующих признаков должно быть одинаковым и находиться в пределах от 5 до 40, т.к. верхняя граница выборки определяется имеющимися таб­лицами критических значений, а именно N<40;
при большом коли­честве одинаковых рангов по одной или обеим сопоставляемым пе­ременным дает огрубленные значения. В случае если есть много повторяющихся рангов, то необ­ходимо вносить поправку на одинаковые ранги
Слайд 23

Пример Два преподавателя оценили знания 12 учащихся по стобалльной системе и


Пример
Два преподавателя оценили знания 12 учащихся по стобалльной системе и выставили

им следующие оценки (в первой строке указано количество баллов, выставленных первым преподавателем, а во второй – вторым):
Найти выборочный коэффициент ранговой корреляции Спирмена между оценками двух преподавателей.
Слайд 24

 

Слайд 25

 

Слайд 26

 

Слайд 27

 

Слайд 28

Пример Известны следующие данные Найти выборочный коэффициент ранговой корреляции Кендалла и


Пример
Известны следующие данные
Найти выборочный коэффициент ранговой корреляции Кендалла и проверить гипотезу

о наличии ранговой корреляции между оценкой экспертов и результатами выборов.
τ > Tкр => нулевая гипотеза отклоняется и ранговая корреляция признается значимой.
Слайд 29

Пример Известны следующие данные об оценке мужем и женой значимых для

Пример
Известны следующие данные об оценке мужем и женой значимых для семейного

благополучия личностных черт
Найти выборочный коэффициент ранговой корреляции Кендалла и проверить гипотезу о наличии ранговой корреляции между мужем и женой в оценке личностных черт.
Слайд 30

Коэффициент корреляции Пирсона Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие

Коэффициент корреляции Пирсона
Для применения коэффициента корреляции Пирсона, необходимо соблюдать следующие условия:


Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.
Распределения переменных X и Y должны быть близки к нормальному.
Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
Таблицы уровней значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам осуществляется при числе степеней свободы k = n - 2.
При выполнении этих условий коэффициент корреляции Пирсона рассчитывается по формуле
Слайд 31

 

Слайд 32

 

Слайд 33

Пример При уровне значимости 0,05

Пример

 

При уровне значимости 0,05

Слайд 34

Пример В некоторой стране годовой доход каждого индивида у определяется по

Пример

В некоторой стране годовой доход каждого индивида у определяется по формуле:
у

= 10000+500s + 200t,
где s — число лет обучения индивида; t — трудовой стаж (в годах); х — возраст индивида. Рассчитайте Cov(x, у), Cov(x, s) и Cov(x, t) для выборки из пяти индивидов
Слайд 35

Коэффициент частной корреляции

Коэффициент частной корреляции

 

Слайд 36

Парный регрессионный анализ.

Парный регрессионный анализ.

Слайд 37

Модель парной линейной регрессии y = α + βx + u

Модель парной линейной регрессии
y = α + βx + u
Величина у,

рассматриваемая как зависимая переменная, состоит из двух составляющих:
неслучайной составляющей α + βх, где х выступает как объясняющая (или независимая) переменная, а постоянные величины α и β — как параметры уравнения;
Случайной составляющей и.
Слайд 38

Основные причины наличия случайной составляющей в модели парной регрессии. Невключение объясняющих

Основные причины наличия случайной составляющей в модели парной регрессии.

Невключение объясняющих переменных.
Агрегирование

переменных.
Неправильное описание структуры модели.
Неправильная функциональная спецификация.
Ошибки измерения.
Слайд 39

Метод наименьших квадратов y= a + bx

Метод наименьших квадратов

y= a + bx

Слайд 40