Фиктивные переменные в регрессионных моделях

Содержание

Слайд 2

Цели лекции Линейные регрессионные моделями с переменной структурой Фиктивные переменные сдвига

Цели лекции

Линейные регрессионные моделями с переменной структурой
Фиктивные переменные сдвига и наклона
Тест

Чоу на наличие структурного сдвига
Слайд 3

Необходимость использования фиктивных переменных На практике часто возникает необходимость использования качественных

Необходимость использования фиктивных переменных

На практике часто возникает необходимость использования
качественных признаков. Влияние

качественного фактора
выражают в виде фиктивной (искусственной) переменной,
отражающей его два противоположных состояния:

Фиктивные переменные позволяют отразить в модели эффекты сдвига и наклона в результате воздействия качественных факторов на зависимую переменную

Слайд 4

Примеры фиктивных переменных Исследуется зависимость между доходом и потреблением с учетом

Примеры фиктивных переменных

Исследуется зависимость между доходом и потреблением с
учетом фактора проживание

(город или сельская местность)

Исследуется зависимость между продолжительностью
полученного образования и доходом, и в выборке
представлены как мужчины, так и женщины. Нужно
выяснить, влияет ли пол на различие в результатах

Исследуется зависимость между объемом продаж магазина и
средней зарплатой с учетом фактора сезонности

Слайд 5

Пример использования фиктивной переменной По выборочным данным (n=73) исследуется зависимость цены

Пример использования фиктивной переменной

По выборочным данным (n=73) исследуется зависимость
цены квартир Y

на вторичном рынке жилья Санкт-
Петербурга в 2000г. (тыс. долл.) от общая площадь X (м2).
Допустим мы хотим отразить в модели район –
центральный или периферийный. Для этого включим в
модель фиктивную переменную сдвига Z: Z=0 для
периферийных районов, Z=1 для центральных районов
Слайд 6

Пример использования фиктивной переменной. Исходные данные

Пример использования фиктивной переменной. Исходные данные

Слайд 7

Пример использования фиктивной переменной Уравнение регрессии без учета района: Уравнение регрессии

Пример использования фиктивной переменной

Уравнение регрессии
без учета района:
Уравнение регрессии с фиктивной переменой

сдвига Z:
Уравнения регрессии для разных районов (по частям выборки):
для Z=0 для Z=1
Слайд 8

Пример использования фиктивной переменной. Графики

Пример использования фиктивной переменной. Графики

Слайд 9

Пример использования фиктивной переменной Из полученных уравнений и графиков видно, что

Пример использования фиктивной переменной

Из полученных уравнений и графиков видно, что
одной фиктивной

переменной сдвига недостаточно.
Введем дополнительно фиктивную переменную,
учитывающую разный наклон данных:

Учет разного сдвига

Учет разного наклона

Слайд 10

Пример использования фиктивной переменной Уравнение регрессии с учетом разного сдвига Z и наклона ZX: или

Пример использования фиктивной переменной

Уравнение регрессии с учетом разного сдвига Z и
наклона

ZX:

или

Слайд 11

Пример использования фиктивной переменной. Графики

Пример использования фиктивной переменной. Графики

Слайд 12

Пример использования фиктивной переменной. Сравнение моделей Вывод.Уравнение регрессии с фиктивными переменными

Пример использования фиктивной переменной. Сравнение моделей

Вывод.Уравнение регрессии с фиктивными переменными
позволяет учесть

в модели качественные признаки
Слайд 13

Слайд 14

Фиктивные переменные сдвига и наклона. Интерпретация коэффициентов На одной части выборки

Фиктивные переменные сдвига и наклона. Интерпретация коэффициентов

На одной части выборки регрессия

имеет коэффициенты b0 и b1.
На другой части выборки они изменяются, соответственно, на
величину коэффициентов при фиктивных переменных сдвига и
наклона

Значимость коэффициентов при фиктивных переменных определяется с помощью t-статистики

Использование фиктивных переменных эквивалентно расчету регрессий на отдельных частях выборки

Слайд 15

Оценка значимости влияния качественных переменных на зависимую переменную Статистическая значимость качественных

Оценка значимости влияния качественных переменных на зависимую переменную

Статистическая значимость качественных переменных
проверяется

по t-критерию: исследуем на значимость
t-статистику коэффициента при данной фиктивной
переменной

Для рассмотренного примера:

Вывод. Район расположения квартиры значимо влияет на ее цену на уровне значимости 1% (надежность равна 99%)

Слайд 16

Виды моделей с качественными объясняющими переменными ANOVA-модели (модели дисперсионного анализа) Содержат

Виды моделей с качественными объясняющими переменными

ANOVA-модели (модели дисперсионного анализа)
Содержат только качественные

объясняющие переменные.
ANOVA-модели представляют собой кусочно-постоянные
функции.

ANCOVA-модели (модели ковариационного анализа)
Содержат как количественные, так и качественные
объясняющие переменные.

Слайд 17

Использование фиктивных переменных в сезонном анализе Учет или нейтрализация сезонного фактора

Использование фиктивных переменных в сезонном анализе

Учет или нейтрализация сезонного фактора с

помощью
фиктивных переменных

сдвига:

сдвига и наклона:

Слайд 18

Фиктивная зависимая переменная. Примеры Анализируется наличие работы у человека в зависимости

Фиктивная зависимая переменная. Примеры

Анализируется наличие работы у человека в зависимости от
возраста,

образования, семейного положения, доходов остальных
членов семьи и т.д. Зависимая переменная имеет вид:

Анализируется результат сдачи с первой попытки экзамена в ГАИ в
зависимости от количества часов вождения, использования
компьютерной методики обучения и т.д. Зависимая переменная:

Слайд 19

Фиктивная зависимая переменная. Модель и ограничения Модель в общем случае имеет

Фиктивная зависимая переменная. Модель и ограничения

Модель в общем случае имеет вид:

Ограниченность

использования МНК для данных моделей:
1. Случайные отклонения εi не имеют нормального распределения.
2. Не выполняется предпосылка 20 постоянства дисперсии D[ε].

Для определения коэффициентов модели используют другие методы

Слайд 20

Тест Чоу. Анализ структурных сдвигов Пример структурного сдвига – выборка имеет две различных подвыборки

Тест Чоу. Анализ структурных сдвигов

Пример структурного сдвига – выборка
имеет две различных

подвыборки
Слайд 21

Тест Чоу. Область применения Суть теста Чоу: проверка гипотезы о совпадении

Тест Чоу. Область применения

Суть теста Чоу: проверка гипотезы о совпадении уравнений
регрессии

для отдельных групп наблюдений (подвыборок)

Ситуации, когда возникает потребность в тесте Чоу:
1. Есть подозрения, что исходная выборка состоит из двух или более разных подвыборок (например, из-за различия качественной переменой)
2. К имеющийся выборке нужно присоединить дополнительные данные. И необходимо выяснить, можно ли считать обе выборки регрессионно однородными.

Слайд 22

Тест Чоу. Описание F-статистика представляет собой отношение меры улучшения качества уравнения

Тест Чоу. Описание

F-статистика представляет собой отношение меры улучшения
качества уравнения в расчете

на одну использованную степень
свободы к мере необъясненной дисперсии в расчете на одну
оставшуюся степень свободы

RSST − сумма квадратов остатков для регрессии по всей выборке; RSS1, RSS2 − по ее частям

Статистика имеет F-распределение с (m+1) и (n −2m −2) степенями свободы

Слайд 23

Тест Чоу. Пример Проверим для α=5% гипотезу о совпадении уравнений регрессии

Тест Чоу. Пример

Проверим для α=5% гипотезу о совпадении уравнений
регрессии для подвыборок,

соответствующих разным
районам Санкт-Петербурга, из рассмотренного примера:

RSST = 1289,756; RSS1 = 509,179 (Z=0); RSS2 = 660,580 (Z+1)

На уровне значимости 5% уравнения регрессии различны