Эконометрика. Оценка значимости уравнения парной линейной регрессии

Содержание

Слайд 2

После того, как получено уравнение линейной регрессии, обязательно проводится оценка его

После того, как получено уравнение линейной регрессии, обязательно проводится оценка его

качества и значимости коэффициентов на основе проверки гипотез
Слайд 3

Статистическая гипотеза (SH) – это предположение о величине параметра распределения генеральной

Статистическая гипотеза (SH) – это предположение о величине параметра распределения генеральной

совокупности.
Проверка (SH) осуществляется на базе двух типов гипотез:
нулевая H0 – допущение, которое считается верным до тех пор, пока не будет доказано обратное, исходя из результатов статистической проверки. В частности, предположение о случайной природе оцениваемых параметров, т.е. о незначимом их отличии от нуля.
альтернативная H1 - гипотеза, которая принимается, если в результате проверки отвергается нулевая гипотеза. В частности, это принятие предположения о неслучайной природе оцениваемых параметров, т.е. их статистическая значимость и надежность: не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора.
Ошибки 1-го рода – вероятность отвержения гипотезы H0, когда она должна быть принята.
Ошибка 2-го рода – вероятность принятия гипотезы H0, когда она должна быть отвергнута .
Слайд 4

Разложение отклонения от среднего

Разложение отклонения от среднего

Слайд 5

Общая вариация переменной Y величина, являющаяся мерой вариации переменной Y вокруг ее среднего значения

Общая вариация переменной Y

величина, являющаяся мерой вариации переменной Y вокруг ее

среднего значения
Слайд 6

Центральное место при этом занимает анализ трех сумм: - общая сумма

Центральное место при этом занимает анализ трех сумм:

- общая сумма квадратов

отклонений изучаемого показателя y от его среднего арифметического значения (total sum of squares)

- сумма квадратов отклонений y, объясняемая регрессией, от среднего арифметического значения изучаемого показателя у (regression sum of squares)

- остаточная сумма квадратов отклонений y, объясняемая влиянием неучтенных при моделировании факторов (error sum of squares)

Слайд 7

Разложение общей вариации переменной Y В этой сумме II = 0. Тогда: I II III

Разложение общей вариации переменной Y

В этой сумме II = 0. Тогда:

I II III
Слайд 8

TSS – total sum of squares – вся дисперсия или вариация

TSS – total sum of squares – вся дисперсия или вариация

Y, характеризует степень случайного разброса значений функции регрессии около среднего значения Y
ESS – error sum of squares – есть сумма квадратов остатков регрессии, та величина, которую мы минимизируем при построении прямой, часть дисперсии, которая нашим уравнением не объясняется
RSS – regression sum of squares – объясненная часть общей вариации
Слайд 9

Для линейной регрессии : TSS = RSS + ESS

Для линейной регрессии :
TSS = RSS + ESS

Слайд 10

Для оценки качества линейной регрессии используют коэффициент детерминации - показывает долю

Для оценки качества линейной регрессии используют коэффициент детерминации

- показывает долю

дисперсии, объясняемую регрессией, в общей дисперсии У

-это величина:

Слайд 11

Связь коэффициента детерминации с коэффициентом корреляции

Связь коэффициента детерминации с коэффициентом корреляции

Слайд 12

Свойства коэффициента детерминации

Свойства коэффициента детерминации

Слайд 13

Суммы квадратов отклонений (TSS, RSS, ESS) имеют определенное число степеней свободы

Суммы квадратов отклонений (TSS, RSS, ESS) имеют определенное число степеней свободы
Число

степеней свободы K связано с числом наблюдений и числом определяемых по ним констант
Слайд 14

Распределение дисперсии на одну степень свободы

Распределение дисперсии
на одну степень свободы

Слайд 15

Оценка значимости уравнения регрессии в целом делается с помощью F-критерия Фишера

Оценка значимости уравнения регрессии в целом делается с помощью F-критерия Фишера

Гипотеза

Н0 (нулевая) об отсутствии связи изучаемого показателя с фактором отклоняется и делается вывод о существенности этой связи с уровнем значимости α, если
Слайд 16

Итак, если Fфакт(рассчет.) > Fтабл. , то гипотеза Н0 о случайной

Итак, если Fфакт(рассчет.) > Fтабл. ,
то гипотеза Н0 о случайной

природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Для оценки статистической значимости коэффициентов регрессии и коэффициента корреляции рассчитывается t-критерий Стьюдента.
Слайд 17

Fтабл – это максимально возможное значение критерия, которое могло сформироваться под

Fтабл – это максимально возможное значение критерия, которое могло сформироваться под

влиянием случайных факторов при данных степенях свободы и уровне значимости α.
Уровень значимости α – вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно принимается равной 0,05 или 0,01.
Имеются таблицы критических (табличных) значений F-критерия: F(α; k1; k2), где , k1=m; k2=n-m-1,
где n – число единиц совокупности;
m – число параметров при переменных х.
Например, для линейного уравнения парной регрессии с уровнем значимости α = 0,05 необходимо в таблице значений (см.приложение) найти значение F(0,05; 1; n – 2).