Эконометрика. Парная регрессия

Содержание

Слайд 2

Парная регрессия Понятия регрессионного анализа: зависимые и независимые переменные. Предпосылки применения

Парная регрессия

Понятия регрессионного анализа: зависимые и независимые переменные.
Предпосылки применения метода наименьших

квадратов (МНК).
Свойства оценок метода наименьших квадратов (МНК).
Линейная модель парной регрессии. Оценка параметров модели с помощью метода наименьших квадратов (МНК).
Показатели качества регрессии модели парной регрессии.
Анализ статистической значимости параметров модели парной регрессии.
Интервальная оценка параметров модели парной регрессии.
Проверка выполнения предпосылок МНК.
Интервалы прогноза по линейному уравнению парной регрессии.(Прогнозирование с применением уравнения регрессии).
Понятие и причины гетероскедастичности. Последствия гетероскедастичности. Обнаружение гетероскедастичности.
Нелинейная регрессия. Нелинейные модели и их линеаризация.
Слайд 3

Типы переменных в эконометрической модели Результирующая (зависимая, эндогенная) переменная Y Она

Типы переменных в эконометрической модели

Результирующая (зависимая, эндогенная) переменная Y
Она характеризует

результат или эффективность функционирования экономической системы. Значения ее формируются в процессе и внутри функционирования этой системы под воздействием ряда других переменных и факторов, часть из которых поддается регистрации, управлению и планированию. По своей природе результирующая переменная всегда случайна (стохастична).
Объясняющие (экзогенные, независимые) переменные X
Это — переменные, которые поддаются регистрации и описывают условия функционирования реальной экономической системы. Они в значительной мере определяют значения результирующих переменных. Еще их называют факторными признаками. В регрессионном анализе это аргументы результирующей функции Y. По своей природе они могут быть как случайными, так и неслучайными.
Слайд 4

Регрессионный анализ Предназначен для исследования зависимости исследуемой переменной от различных факто-ров

Регрессионный анализ

Предназначен для исследования зависимости исследуемой переменной от различных

факто-ров и отображения их взаимосвязи в форме регрессионной модели.
Зависимая (объясняемая) переменная = > Y
Независимые (объясняющие) переменные =>X
По виду функции различают модели:
линейные;
нелинейные.
По количеству включенных факторов:
- однофакторные (парной регрессии);
- многофакторные (множественной регрессии).
Слайд 5

Предпосылки применения метода наименьших квадратов (МНК) Первое условие. Математическое ожидание случайной

Предпосылки применения метода наименьших квадратов (МНК)

Первое условие. Математическое ожидание случайной составляющей

в любом наблюдении должно быть равно нулю


Второе условие состоит в том, что возмущение (или зависимая переменная ) есть величина случайная.

Третье условие предполагает отсутствие систематической связи между значениями случайной составляющей в любых двух наблюдениях

Четвертое условие означает, что дисперсия случайной составляющей должна быть постоянна для всех наблюдений. Это условие гомоскедастичности.

Предположение о нормальности
Наряду с перечисленными условиями Гаусса— Маркова обычно также предполагается нормальность распределения случайного члена.

Слайд 6

Свойства оценок метода наименьших квадратов (МНК) Оценки параметров регрессии должны быть несмещенными, состоятельными и эффективными

Свойства оценок метода наименьших квадратов (МНК)

Оценки параметров регрессии должны быть несмещенными,

состоятельными и эффективными
Слайд 7

Линейная парная регрессия yi = a0 + a1 · xi +

Линейная парная регрессия

yi = a0 + a1 · xi

+ ε i ,
где a0 – постоянная величина,
a1 – коэффициент регрессии, характери-зует угол наклона линии регрессии.
Если a1 > 0, то переменные x и y положительно коррелированы, если a1 < 0 – отрицательно.
a0 + a1 · xi - неслучайная составляющая;
ε i – случайная составляющая с нулевым математическим ожиданием и постоянной дисперсией, она учитывает неучтенные факторы, ошибки измерения и пр.
Слайд 8

Матричная форма оценки параметров уравнения регрессии МНК Y = X ·

Матричная форма оценки параметров уравнения регрессии МНК

Y = X ·

A + ε ,
где Y – вектор-столбец (nx1) наблюдаемых значений зависимой переменной;
X – матрица (nx2) значений факторов;
A – вектор-столбец (2x1) неизвестных коэффициентов регрессии;
ε – вектор-столбец (nx1) ошибок наблюдений
Слайд 9

Решение системы нормальных уравнений в матричном виде: A = (X’·X)-1·X’·Y .


Решение системы нормальных уравнений
в матричном виде: A = (X’·X)-1·X’·Y

.
Для расчета вектора A необходимо:
Транспонировать матрицу X => [ ТРАНСП];
Умножить транспонированную матрицу на исходную (X’X) => [МУМНОЖ];
Вычислить обратную матрицу (X’X)-1 => [МОБР];
Слайд 10

Метод наименьших квадратов

Метод наименьших квадратов

Слайд 11

Оценка параметров уравнения регрессии МНК МНК минимизирует сумму квадратов отклонения фактических

Оценка параметров уравнения регрессии МНК

МНК минимизирует сумму квадратов отклонения фактических

значений yi от расчетных
a1= = =
=
__ __
a0 = y – a1 · x .
yp = a0 + a1· x
Слайд 12

Оценка качества модели регрессии Качество модели оценивается на основе анализа остаточной

Оценка качества модели регрессии

Качество модели оценивается на основе анализа остаточной

компоненты (εi = yi – yр ):
Качество модели регрессии оценивается по следующим направлениям:
проверка качества всего уравнения регрессии;
проверка значимости всего уравнения регрессии;
проверка статистической значимости коэффициентов уравнения регрессии;
проверка выполнения предпосылок МНК.
Слайд 13

В основе анализа качества лежит теорема о разложении дисперсии на две

В основе анализа качества лежит теорема о разложении дисперсии на две

составляющие:
дисперсия объясненная необъясненная
Разделив обе части уравнения на левую получим:
Коэффициент детерминации R2
Откуда, в окончательном виде имеем :
Слайд 14

Коэффициент детерминации показывает долю вариации результативного признака, находяще-гося под воздействием изучаемых


Коэффициент детерминации показывает долю вариации результативного признака, находяще-гося под воздействием изучаемых

факторов.
Чем ближе R2 к 1, тем выше качество модели.
Если R2 =0 ? – связь между признаками отсутствует Если R2 = 1 ? - связь функциональная
Коэффициент множественной корреляции R
R = =
Он отражает и тесноту связи и точность модели
Слайд 15

Основные свойства коэффициента детерминации 1. 0 2. Чем ближе R2 к

Основные свойства
коэффициента детерминации

1. 0 < R2 < 1.

2. Чем ближе R2

к 1, тем лучше регрессия аппроксимирует статистические данные, тем теснее линейная связь между зависимой и объясняющими переменными.

3. Если R2 = 1, то статистические данные лежат на линии регрессии, т.е. между зависимой и объясняющими переменными имеется функциональная зависимость. Если R2 = 0, то вариация зависимой переменной полностью обусловлена воздействием неучтенных в модели переменных.

4. В случае парной регрессии R2 = r 2.

Слайд 16

Слайд 17

Для однофакторной модели R = | ry,x |. Критерий Фишера используется

Для однофакторной модели R = | ry,x |.
Критерий Фишера используется

для проверки значимости модели регрессии при выбранном уровне α и степенях свободы k1 и k2. Для однофакторной модели регрессии:
Критерии точности модели
Средняя квадратическая ошибка –
(стандартная ошибка оценки)
- для однофакторной модели
Слайд 18

Если Sε ≤ σy, то модель регрессии использовать целесообразно. Средняя относительная

Если Sε ≤ σy, то модель регрессии использовать целесообразно.
Средняя относительная

ошибка аппроксимации:
A
Если A ≤ 7%, то модель имеет хорошее качество.
Проверка гипотез о значимости параметров уравнения регрессии.
Выдвигается H0 – гипотеза о незначимом отличии параметра уравнения регрессии от нуля.
Для проверки этой гипотезы используется t – статистика (имеющая распределение Стьюдента).
Слайд 19

Показатели качества коэффициентов регрессии Стандартные ошибки оценок (анализ точности определения оценок).

Показатели качества
коэффициентов регрессии

Стандартные ошибки оценок (анализ точности определения оценок).
2. Значения t-статистик

(проверка гипотез относительно коэффициентов регрессии).
3. Интервальные оценки коэффициентов линейного уравнения регрессии.
4. Доверительные области для зависимой переменной.
Слайд 20

Стандартные ошибки оценок Оценки b0 и b1 являются случайными величинами. Отсюда

Стандартные ошибки оценок

Оценки b0 и b1 являются случайными величинами. Отсюда

следует, что стандартные ошибки коэффициентов регрессии - это средние квадратические отклонения коэффициентов регрессии от их истинных значений.

2

Слайд 21

Свойства дисперсий оценок 1. Дисперсии D[b0] и D[b1] прямо пропорциональны дисперсии

Свойства дисперсий оценок
1. Дисперсии D[b0] и D[b1] прямо пропорциональны дисперсии случайного

отклонения Следовательно, чем больше фактор случайности, тем менее точными будут оценки.

2. Чем больше число наблюдений n, тем меньше дисперсии оценок.

3. Чем больше дисперсия объясняющей переменной, тем меньше дисперсия оценок коэффициентов регрессии. Другими словами, чем шире область изменений объясняющей переменной, тем точнее будут оценки (тем меньше доля случайности в их определении).

Стандартная ошибка является оценкой среднего квадратического отклонения коэффициента регрессии от его истинного значения

Слайд 22

Использование стандартных ошибок Сравнивая значение коэффициента с его стандартной ошибкой, можно

Использование стандартных
ошибок

Сравнивая значение коэффициента с его стандартной ошибкой, можно судить о

значимости коэффициента
Коэффициент называется значимым, если есть достаточно высокая вероятность того, что его истинное значение отлично от нуля

Для стандартных ошибок оценок нет таблиц критическихуровней — для точного суждения используются t-статистики

Слайд 23

Типичные ошибки в использовании показателей качества регрессии - Величина коэффициентов регрессии

Типичные ошибки в использовании
показателей качества регрессии

- Величина коэффициентов регрессии не указывает

на силу связи или силу влияния на зависимую переменную
- Значимость коэффициентов по t-тестам не позволяет сделать вывод о справедливости тех или иных теорий
- t-статистики не указывают на относительную важность коэффициентов регрессии
- t-статистики предназначены для использования
исключительно для выборки и бесполезны для анализа всей совокупности
- Нельзя сравнивать t-статистики, F-статистики,
коэффициенты детерминации и др. у разных уравнений
Слайд 24

Расчетные значения t – критерия определяются по формулам: tb0 = |b0|

Расчетные значения t – критерия определяются по формулам:
tb0 = |b0|

/ Sb0 и ta1 = |b1| / Sb1 ,
где Sb0
Sb1
Здесь tа0 или tа1>tтабл , то параметр значим
[В Excel tтабл => СТЬЮДРАСПОБР]
Слайд 25

Интервальная оценка параметров модели выполняется для значимого уравнения по формулам: a0

Интервальная оценка параметров модели
выполняется для значимого уравнения по формулам:

a0 =[a0 ± tтабл·Sa0 ] – для свободного члена a0 ;
a1 = [a1 ± tтабл·Sa1 ] – для параметра a1 .
где tтабл – критерий Стьюдента для k =n-2 степеней,
Sa0 ,Sa1 – стандартные отклонения
Прогнозирование по уравнению регрессии
Точечный прогноз получают подстановкой ожидаемого значения xпрогн в уравнение: yпрогн=a0+ a1·xпрогн
Поскольку вероятность точечного прогноза близка к нулю, то рассчитывается доверительный интервал, в который с вероят-ностью (1-α ) попадут прогнозные значения y прогн.
Слайд 26

Средняя ошибка прогноза Точечный прогноз ± Интервальный прогноз =


Средняя ошибка прогноза

Точечный
прогноз

±

Интервальный
прогноз

=

Слайд 27

Графическая интерпретация результатов расчета y Нижняя доверительная граница Верхняя доверительная граница Линия регрессии Доверительный интервал x

Графическая интерпретация результатов расчета

y

Нижняя
доверительная
граница

Верхняя
доверительная
граница

Линия
регрессии

Доверительный
интервал

x

Слайд 28

Регрессионный анализ предназначен для исследования зависимости исследуемой переменной от различных факторов

Регрессионный анализ
предназначен для исследования зависимости исследуемой переменной от различных факторов

и отображения их взаимосвязи в форме регрессионной модели.
В регрессионных моделях зависимая переменная Y может быть представлена в виде функции f (Х), где - Х1,Х2,…,Хm независимые (объясняющие) переменные, или факторы.
Связь между переменной Y и m независимыми факторами Х можно охарактеризовать функцией регрессии Y= f (Х1,Х2,…,Хm ), которая показывает, каково будет в среднем значение переменной yi, если переменные Xi примут конкретные значения.
Слайд 29

Регрессионные модели с переменной структурой (фиктивные переменные). Построена регрессионная модель зависимости

Регрессионные модели с переменной структурой (фиктивные переменные).

Построена регрессионная модель зависимости заработной

платы работника (Y) от возраста (Х) с использованием фиктивной переменной по фактору пол по 20 работникам одного предприятия
Из полученного уравнения регрессии следует, что при одном и том же возрасте заработная плата у работников мужчин на 17,27$ в месяц выше, чем у женщин.
Из модели, включающей фиктивную переменную можно получить частные уравнения регрессии для работников мужчин (z=1) и женщин (z=0):
Слайд 30

Слайд 31

Администрация страховой компании приняла решение о введении нового вида услуг –


Администрация страховой компании приняла решение о введении нового вида

услуг – страхование на случай пожара. С целью определения тарифов по выборке из 10 случаев пожаров анализируется зависимость стоимости ущерба, нанесенного пожаром от расстояния до ближайшей пожарной станции.

Задача

Слайд 32

Слайд 33

Прогноз по модели Y=10,25+4,69X Прогноз Х По исходным данным полагают, что

Прогноз по модели Y=10,25+4,69X

Прогноз Х
По исходным данным полагают, что расстояние до ближайшей

пожарной станции уменьшится на 5% от своего среднего уровня

Прогноз Y

Слайд 34

Построение доверительного интервала прогноза Стандартная ошибка 1.801

Построение доверительного интервала прогноза

Стандартная ошибка 1.801

Слайд 35

Построение доверительного интервала прогноза Строим доверительный интервал прогноза ущерба с вероятностью

Построение доверительного интервала прогноза
Строим доверительный интервал прогноза ущерба с вероятностью 0,90

(t=1,86). Из полученных результатов видно, что интервал от 20,67 до 27,7 тыс. руб. ожидаемой величины ущерба довольно широкий. Значительная неопределенность прогноза линии регрессии, связана, прежде всего с малым объемом выборки (n=10), а также тем, что по мере удаления прогнозного знаения Х от среднего ширина доверительного интервала увеличивается.

Стандартная ошибка 1.801

Слайд 36

График прогноза

График прогноза

Слайд 37

Нелинейная регрессия При описании экономических процессов могут использоваться также и нелинейные

Нелинейная регрессия

При описании экономических процессов могут использоваться также и нелинейные функции.

Различают два класса нелинейных регрессий:
Нелинейные относительно объясняющих переменных, но линейные по оцениваемым параметрам:
Полиномы разных степеней
yi = a0 + a1·xi + a2·xi2 + a3·xi3 + … + ak·xik + εi
Равносторонняя гипербола yi = a0 + a1 / xi + εi .
Нелинейные по оцениваемым параметрам:
Степенная yi = a0 · xi a1 · εi кривые спроса,предложения, Энгеля, производственные функции,
кривые освоения, зависимость вал. Нац. Прод. От уровня занятости
Слайд 38

Показательная yi = a0 · a1 xi · εi Экспоненциальная yi

Показательная yi = a0 · a1 xi · εi
Экспоненциальная yi

= e a0 + a1· xi · εi
Первый класс нелинейных моделей легко сво-дится к линейным путем замены нелинейных переменных xk новыми линейными переменны-ми zk и затем применяют МНК.
Во втором классе выделяют два подкласса:
Внутренне линейные – путем преобразований сводятся к линейному виду;
Внутренне нелинейные – путем логарифмирования приводятся к линейному виду, либо используются итеративные процедуры оценки параметров.
Остальное см. практику
Слайд 39

Альтернативные функциональные формы: правила выбора Правила выбора формы зависимости: 1. Исходить

Альтернативные функциональные
формы: правила выбора

Правила выбора формы зависимости:
1. Исходить из экономической теории.
2.

Оценивать формальное качество модели.
3. Дополнительно проверять по нескольким содержательным критериям.
4. Ответить на вопросы, возникающие при анализе модели:
- каковы признаки качественной модели;
- какие ошибки спецификации встречаются и каковы их последствия;
- как обнаружить ошибку спецификации;
- каким образом можно исправить ошибку спецификации и перейти к более качественной модели.