Парная линейная регрессия и метод наименьших квадратов

Содержание

Слайд 2

Цели лекции Раскрыть понятие регрессии. Познакомиться с методом наименьших квадратов – методом построения линейного уравнения регрессии.

Цели лекции

Раскрыть понятие регрессии.
Познакомиться с методом наименьших квадратов – методом построения

линейного уравнения регрессии.
Слайд 3

Виды зависимостей между переменными 1. Функциональные: Y = f(X). Имеют место

Виды зависимостей между переменными

1. Функциональные: Y = f(X).
Имеют место при исследовании

связей между
неслучайными переменными. Такие связи в
эконометрике не рассматриваются.
2. Статистические: изменение одной из величин влечет изменение закона распределения другой (доход – потребление, цена – спрос и т.д.).
Слайд 4

Виды статистических зависимостей а) Корреляционные: при изменении одной из величин изменяется

Виды статистических зависимостей

а) Корреляционные: при изменении одной из величин изменяется среднее

значение другой (связь между переменными не носит направленного характера)
M[Y/X = x] = Mx[Y] = ϕ(x), M[X/Y = y] = My[X] = ψ(y),
где M[Y/X = x] − м. о. случайной величины Y, вычисленное при условии, что случайная величина X приняла значение x, ϕ(x) ≠ const, ψ(y) ≠ const.
б) Регрессионные: односторонняя зависимость среднего значения случайной величины Y от одной X или нескольких X1,…,Xm случайных величин.
Слайд 5

Пример: Регрессионная зависимость y 2 Y=2+x Возможные значения y для данного значения x x

Пример: Регрессионная зависимость

y
2

Y=2+x

Возможные значения y для данного значения x

x

Слайд 6

Что такое регрессионный анализ? Регрессионный анализ – наиболее часто используемый инструмент

Что такое регрессионный анализ?

Регрессионный анализ – наиболее часто используемый инструмент в

эконометрике.
Регрессионный анализ представляет собой анализ форм связи, устанавливающих количественные соотношения между случайными величинами изучаемого случайного процесса.
Слайд 7

Определение регрессии Регрессия – функциональная зависимость между объясняющими переменными и условным

Определение регрессии

Регрессия – функциональная зависимость между объясняющими переменными и условным математическим

ожиданием (средним значением) зависимой переменной, которая строится с целью прогнозирования этого среднего значения при фиксированных значениях объясняющих переменных.
Слайд 8

Регрессионные модели Mx[Y] = ϕ(X) − парная регрессия, Mx[Y] = ϕ(X1,…,Xm)

Регрессионные модели

Mx[Y] = ϕ(X) − парная регрессия,
Mx[Y] = ϕ(X1,…,Xm) − множественная

регрессия,
где ϕ(X) ≠ const,
X − объясняющая, входная, предсказывающая,
экзогенная, неслучайная переменная, фактор,
регрессор, факторный признак;
Y − зависимая, объясняемая, выходная,
результирующая, эндогенная, случайная
переменная, результирующий признак.
Слайд 9

Пример: Парная регрессия Мы хотим определить зависимость между продажами и затратами

Пример: Парная регрессия

Мы хотим определить зависимость между продажами и затратами на рекламу.
y

– продажи.
x – рекламные расходы.
Слайд 10

Пример: Множественная регрессия Мы хотим определить связь между потреблением, доходом семьи,

Пример: Множественная регрессия

Мы хотим определить связь между потреблением, доходом семьи, финансовыми активами

семьи и размером семьи.
y – потребительские расходы.
x1 – доход семьи.
x2 – финансовые активы семьи.
x3 – размер семьи.
Слайд 11

Регрессионные уравнения Y = M[Y/x] + ε = ϕ(x) + ε

Регрессионные уравнения

Y = M[Y/x] + ε = ϕ(x) + ε −

уравнение парной регрессии,
Y = M[Y/x1 ,…, xm] + ε = ϕ(x1 ,…, xm) + ε − уравнение множественной регрессии,
где ε − случайный фактор (остаток), обусловленный многими причинами.
В зависимости от вида функции ϕ(x) модели делятся на линейные и нелинейные.
Слайд 12

Причины обязательного присутствия случайного фактора Невключение в модель всех объясняющих переменных.

Причины обязательного присутствия случайного фактора
Невключение в модель всех объясняющих переменных.
Неправильный выбор

функциональной формы модели.
Агрегирование переменных (факторы представляют собой комбинацию других переменных).
Ошибки измерений.
Ограниченность статистических данных.
Непредсказуемость человеческого фактора.
Слайд 13

Этапы построения качественного уравнения регрессии 1. Определение конечных целей эконометрического моделирования,

Этапы построения качественного уравнения регрессии

1. Определение конечных целей эконометрического моделирования, набора

участвующих в модели факторов и их роли (постановочный этап).
2. Предмодельный анализ экономической сущности изучаемого явления (априорный этап).
3. Сбор необходимой статистической информации (информационный этап).
Слайд 14

Этапы построения качественного уравнения регрессии 4. Выбор формулы уравнения регрессии (спецификация

Этапы построения качественного уравнения регрессии

4. Выбор формулы уравнения регрессии (спецификация уравнения

регрессии).
5. Определение параметров выбранного уравнения (параметризация).
6. Анализ качества уравнения и проверка его адекватности эмпирическим данным, совершенствование уравнения (верификация).
Слайд 15

Выбор формы парной регрессии В случае парной регрессии выбор формулы обычно

Выбор формы парной регрессии

В случае парной регрессии выбор формулы обычно осуществляется

по графическому изображению реальных статистических данных в виде точек (корреляционное поле или диаграмма рассеивания).
Слайд 16

Примеры взаимосвязи между переменными а) Взаимосвязь между Y и X близка

Примеры взаимосвязи между переменными

а) Взаимосвязь между Y и X близка к

линейной: Y = a + bX
б) Взаимосвязь близка к квадратической: Y = a + bX + cX2
в) Взаимосвязь между Y и X отсутствует. Какую бы мы ни выбрали форму связи, результаты проверки ее качества будут неудачными
Слайд 17

Парная линейная регрессия Модель линейной регрессии является наиболее распространенной (и простой)

Парная линейная регрессия

Модель линейной регрессии является
наиболее распространенной (и простой)
зависимостью между переменными,

а также
может служить начальной точкой
эконометрического анализа.
Слайд 18

Модель Кейнса Рассмотрим модель Кейнса зависимости частного потребления С от располагаемого

Модель Кейнса

Рассмотрим модель Кейнса зависимости частного
потребления С от располагаемого дохода I:

С = С0+bI,
где С0 − величина автономного потребления, b − предельная
склонность к потреблению (0 < b ≤ 1)
Слайд 19

Модель парной линейной регрессии Теоретическая парная линейная регрессионная модель: где β0,

Модель парной линейной регрессии

Теоретическая парная линейная регрессионная
модель:
где β0, β1 − теоретические

коэффициенты регрессии,
εi − случайное отклонение.
В общем виде теоретическую парную линейную
регрессионную модель будем представлять в виде:
Слайд 20

Задачи линейного регрессионного анализа Задачи линейного регрессионного анализа состоят в том,

Задачи линейного регрессионного анализа

Задачи линейного регрессионного анализа состоят в
том, чтобы по

имеющимся статистическим данным
(xi, yi), i = 1, 2, …, n, для переменных X и Y:
а) получить наилучшие оценки параметров β0 и β1;
б) проверить статистические гипотезы о параметрах модели;
в) проверить, адекватность модели данным наблюдений.
Слайд 21

Эмпирическое уравнение регрессии По выборке ограниченного объема нельзя точно определить теоретические

Эмпирическое уравнение регрессии

По выборке ограниченного объема нельзя точно
определить теоретические значения β0

и β1..
Можно лишь построить эмпирическое уравнение
регрессии:
где b0 и b1 – оценки параметров β0 и β1 эмпирические
коэффициенты регрессии).
– оценка условного м. о. M[Y/X = xi].
Слайд 22

Эмпирическое уравнение регрессии В результате имеем: где ei – оценка теоретического

Эмпирическое уравнение регрессии

В результате имеем:
где ei – оценка теоретического случайного

отклонения εi .
Оценки b0 и b1 отличаются от истинных значений β0 и β1,
что приводит к несовпадению эмпирической и
теоретической линий регрессии. По различным
выборкам из одной и той же генеральной
совокупности получают разные значения оценок
коэффициентов регрессии.
Слайд 23

Эмпирическое и теоретическое уравнения регрессии Соотношение между теоретическим и эмпирическим уравнениями регрессии схематично имеет вид:

Эмпирическое и теоретическое уравнения регрессии

Соотношение между теоретическим и эмпирическим уравнениями регрессии

схематично имеет вид:
Слайд 24

Задача определения коэффициентов регрессии Задача состоит в нахождении по выборке данных

Задача определения коэффициентов регрессии

Задача состоит в нахождении по выборке данных
оценок b0

и b1 так, чтобы построенная линия регрессии
была наилучшей в определенном смысле среди всех
других прямых. Решение основано на минимизации:
где g – некоторая функция.
Слайд 25

Метод наименьших квадратов Наиболее распространена методом наименьших квадратов (МНК), реализующий минимизацию

Метод наименьших квадратов

Наиболее распространена методом наименьших квадратов
(МНК), реализующий минимизацию суммы

квадратов
отклонений:
Основные особенности МНК:
Он наиболее простой с вычислительной точки зрения.
Оценки коэффициентов регрессии по МНК при определенных предпосылках обладают рядом оптимальных свойств.
Слайд 26

Метод наименьших квадратов Пусть по выборке данных (xi, yi), i =

Метод наименьших квадратов

Пусть по выборке данных (xi, yi), i = 1,

2, …, n,
требуется определить оценки b0 и b1 эмпирического
уравнения регрессии:
Слайд 27

Метод наименьших квадратов В этом случае минимизируется функция: Т.к. функция Q(b0,b1)

Метод наименьших квадратов

В этом случае минимизируется функция:
Т.к. функция Q(b0,b1) непрерывна, выпукла

и ограничена
снизу, то она имеет минимум.

Необходимым условием минимума Q(b0,b1) является
равенство нулю ее частных производных по неизвестным
параметрам b0 и b1.

Слайд 28

Метод наименьших квадратов Приравняем нулю частные производные и затем разделим на n оба уравнения:

Метод наименьших квадратов

Приравняем нулю частные производные и затем
разделим на n оба

уравнения:
Слайд 29

Оценки метода наименьших квадратов Решив последнюю систему уравнений, получим:

Оценки метода наименьших квадратов

Решив последнюю систему уравнений, получим:

Слайд 30

Матричная форма записи МНК эквивалентен ортогональности матрицы Х и вектора е:

Матричная форма записи

МНК эквивалентен ортогональности матрицы Х и вектора е:

Слайд 31

Выводы 1. Оценки МНК являются функциями от выборки, что позволяет их

Выводы

1. Оценки МНК являются функциями от выборки, что позволяет их легко

рассчитать.
2. Оценки МНК являются точечными оценками теоретических коэффициентов регрессии.
3. Эмпирическая прямая регрессии обязательно проходит через точку
Слайд 32

Выводы 4. Эмпирическое уравнение регрессии построено так, что 5. Случайные отклонения

Выводы

4. Эмпирическое уравнение регрессии построено так, что
5. Случайные отклонения ei не

коррелированы с наблюдаемыми значениями yi зависимой переменной Y.
6. Случайные отклонения ei не коррелированы с наблюдаемыми значениями xi независимой переменной X.
Слайд 33

Другие методы определения коэффициентов регрессии Другие методы определения коэффициентов регрессии: метод

Другие методы определения коэффициентов регрессии

Другие методы определения коэффициентов регрессии:
метод наименьших модулей

(МНМ),
метод моментов (ММ),
метод максимального правдоподобия (ММП).
Слайд 34

Пример (A) построения уравнения регрессии При анализе зависимости объема потребления Y

Пример (A) построения уравнения регрессии

При анализе зависимости объема потребления Y (у.е.)
домохозяйства

от располагаемого дохода X (у.е.) отобрана
выборка объема n = 12 (помесячно в течение года),
результаты которой приведены в таблице:
Слайд 35

Пример (A) построения уравнения регрессии Для определения вида зависимости построим корреляционное поле:

Пример (A) построения уравнения регрессии

Для определения вида зависимости построим
корреляционное поле:

Слайд 36

Пример (A) построения уравнения регрессии По расположению точек на корреляционном поле

Пример (A) построения уравнения регрессии

По расположению точек на корреляционном поле
делаем предположение

о линейной зависимости:
Согласно МНК, имеем:
Слайд 37

Пример (A) построения уравнения регрессии Т.о., уравнение парной линейной регрессии имеет

Пример (A) построения уравнения регрессии

Т.о., уравнение парной линейной регрессии имеет вид:
Изобразим

данную прямую регрессии на корреляционном
поле. По этому уравнению рассчитаем , а также
Для анализа степени линейной зависимости вычислим:
Отсюда можно сделать вывод о сильной прямой линейной
зависимости между переменными.
Слайд 38

Пример (A). Таблица расчетов по МНК

Пример (A). Таблица расчетов по МНК