Регрессионный анализ. МНК. Метод главных компонент

Содержание

Слайд 2

Линейная регрессия 2 Продавец настольных игр собрал статистику по ценам и

Линейная регрессия

2

Продавец настольных игр собрал статистику по ценам и объемам продаж

игры «Диксит» с января 2016 по апрель 2018 г.

Задача 1а «Продажи в зависимости от цены»

= ЛИНЕЙН (у1,…,yn; ; 1; 1).
3 × (p+1) ⇒ формула ⇒ Ctrl-Shift-Enter

tкрит = СТЬЮДРАСПОБР(0,05; 28 – 1 – 1) = 2,06.
Цена не значима при α = 0,05.

Модель не значима при α = 0,05.

Слайд 3

Линейная регрессия 3 Продавец также собрал данные о рекламном бюджете фирмы.

Линейная регрессия

3

Продавец также собрал данные о рекламном бюджете фирмы.

Задача 1b «Продажи

в зависимости от цены и рекламы»

tкрит = СТЬЮДРАСПОБР(0,05; 28 – 2 – 1) = 2,06.
Цена не значима, реклама значима при α = 0,05.

Модель значима при α = 0,05.

Слайд 4

Линейная регрессия 4 Продавец учел число праздничных дней в месяце. Задача

Линейная регрессия

4

Продавец учел число праздничных дней в месяце.

Задача 1c «Продажи в

зависимости от цены, рекламы и праздников»

tкрит = СТЬЮДРАСПОБР(0,05; 28 – 3 – 1) = 2,06.
Цена и реклама значимы, праздники нет.

Модель значима при α = 0,05.

Слайд 5

Линейная регрессия 5 Задача 1d «Продажи в зависимости от цены, рекламы,

Линейная регрессия

5

Задача 1d «Продажи в зависимости от цены, рекламы, праздников и

цены ближайшего конкурента»

tкрит = СТЬЮДРАСПОБР(0,05; 23) = 2,07.
Все переменные значимы при α = 0,05.

Модель значима при α = 0,05.

Слайд 6

Линейная регрессия 6 Задача 1е «Продажи в зависимости от цены, рекламы,

Линейная регрессия

6

Задача 1е «Продажи в зависимости от цены, рекламы, праздников, цены

ближайшего конкурента и будущих праздников»

Все переменные значимы при α = 0,05.

Модель значима при α = 0,05.

Возможные дальнейшие шаги: тренд, доход, макропоказатели, учет инфляции (через индексацию), нелинейные зависимости. Они могут ухудшить модель!

Слайд 7

Метод главных компонент 7 Задача 2 «Эмпирическое исследование на основе опроса

Метод главных компонент

7

Задача 2 «Эмпирическое исследование на основе опроса ВЦИОМ перед

выборами 2007 г.» (Алексей Захаров, НИУ ВШЭ)

Дополнительные вопросы:
Намерение голосовать за ту или иную партию на выборах.
Демографические характеристики (пол, возраст, образование, доход).
Заинтересованность политикой.
Степень влияния на жизнь в стране.
Регион и тип населенного пункта, где проживает респондент.
Доверие к Президенту, другим органам власти.

Дано: 40 понятий.
Каждый из 1589 респондентов выбирает несколько (в пределах 15), вы-зывающих у него положительную или отрицательную реакцию.

Модификация данных:
Каждому понятию присвоено значение
–1, если оно вызывает у респондента отрицательные чувства,
1, если оно вызывает у респондента положительные чувства,
0, если оно не вызывает никаких чувств.

Слайд 8

Табл.1. Доля респондентов, оценивших понятие как положительное или отрицательное 8 Исходные данные

Табл.1. Доля респондентов, оценивших понятие
как положительное или отрицательное

8

Исходные данные

Слайд 9

Табл.2. Коэффициенты корреляции главных компонент и исходных переменных 9 Матрица факторных нагрузок

Табл.2. Коэффициенты корреляции главных компонент и исходных переменных

9

Матрица факторных нагрузок

Слайд 10

z(1) – «толерантность» / «успешность» / «безразличие» Высокое значение соответствует отсутствию

z(1) – «толерантность» / «успешность» / «безразличие»
Высокое значение соответствует отсутствию отрицательной

реакции на слова «элита», «нерусские», «рынок», «запад», «власть» и «реформа», и отсутствию положительной реакции на слова «справедливость» и «труд».
z(2) – «экономическая свобода»
Высокое значение соответствует положительной реакции на слова «свобода», «бизнес», «успех», «богатство», «достаток», «прогресс» и «капитализм» и от рицательной реакции на «социализм», «коммунизм», «СССР», «революцию» и «коллективизм».

Рис.1. Собственные числа главных компонент

10

Интерпретация главных компонент

Слайд 11

11 Распределение предпочтений – все респонденты Рис.2. Распределение предпочтений – все респонденты

11

Распределение предпочтений –
все респонденты

Рис.2. Распределение предпочтений – все респонденты

Слайд 12

12 1. Партийные симпатии Рис.3. Партийные симпатии Табл.3. Партийные симпатии

12

1. Партийные симпатии

Рис.3. Партийные симпатии

Табл.3. Партийные симпатии

Слайд 13

13 2. Доход Рис.4. Доход Табл.4. Доход

13

2. Доход

Рис.4. Доход

Табл.4. Доход

Слайд 14

14 3. Образование Рис.5. Образование Табл.5. Образование

14

3. Образование

Рис.5. Образование

Табл.5. Образование

Слайд 15

15 4. Заинтересованность политикой Рис.6. Заинтересованность политикой Табл.6. Заинтересованность политикой Если

15

4. Заинтересованность политикой

Рис.6. Заинтересованность политикой

Табл.6. Заинтересованность политикой

Если наложить данные графики на
графики

партийных предпочтений,
обнаружим, что наиболее интересу-
ются политикой сторонники КПРФ
и СР (низкие значения обоих факто-
ров), а наименее – сторонники пра-
вых партий (высокое значение вто-
рого фактора).
Слайд 16

16 5. Федеральный округ Рис.7. Федеральный округ Табл.7. Федеральный округ

16

5. Федеральный округ

Рис.7. Федеральный округ

Табл.7. Федеральный округ

Слайд 17

17 6. Регионы Рис.8. Регионы 99 – Москва 04 – Алтай

17

6. Регионы

Рис.8. Регионы

99 – Москва
04 – Алтай
58 – Пензенская обл.
61

– Ростовская обл.
54 – Новосибирская обл.
02 – Башкирия
42 – Кемеровская обл.
69 – Тверская обл.
53 – Новгородская обл.
25 – Приморский край
72 – Тюменская обл.
65 – Сахалинская обл.
30 – Астраханская обл.
Слайд 18

18 7. Размер населенного пункта Рис.9. Размер населенного пункта Табл.8. Размер населенного пункта

18

7. Размер населенного пункта

Рис.9. Размер населенного пункта

Табл.8. Размер населенного пункта

Слайд 19

19 8. Москва Рис.10. Москва. 2 кластера: недовольные «экономически продвинутые» и

19

8. Москва

Рис.10. Москва. 2 кластера:
недовольные «экономически продвинутые»
и довольные «непродвинутые»

Рис.11. Москва. Партии
2

– ЕР, 3 – КПРФ, 4 – ЛДПР,
7 – СР, 10 – Яблоко, 14 – не голосов.
Слайд 20

20 9. Доверие к Путину. Готовность к акциям протеста Табл.10. Готовность

20

9. Доверие к Путину.
Готовность к акциям протеста

Табл.10. Готовность к акциям протеста

Табл.9.

Доверие к Путину

Модель множественного выбора

Образование (0→1) Не влияет
Доверие к власти (0→1) ЕР (+)
Жизнь в деревне (0/1)
Бедность (0→1) ЛДПР(+)
Возраст (в годах) КПРФ (+), СР (+)
Пол ЛДПР (М)
Степень влияния на жизнь в стране

Слайд 21

21 Игра: моделирование избирателя Табл.12. Процент голосующих за партии (мужчины) Табл.11.

21

Игра: моделирование избирателя

Табл.12. Процент голосующих за партии (мужчины)

Табл.11. Процент голосующих за

партии (мужчины / женщины)
Слайд 22

22 Игра: моделирование избирателя Табл.13. Процент голосующих за партии (факт /

22

Игра: моделирование избирателя

Табл.13. Процент голосующих за партии (факт / наличие «против

всех»)

Профили репрезентативных избирателей ключевых партий:
ЕР (97%): женщина, z(1)=0, z(2)=0, 30 лет, город, обеспеченная, доверяет Путину, доверяет Думе, влияет на жизнь.
ЛДПР (88%): мужчина, z(1)= –1,7, z(2)=1,7, 30 лет, город, бедный, не доверяет Путину, доверяет Думе, не влияет на жизнь.
КПРФ (33%): мужчина, z(1)=–1,7, z(2)=–1,7, 60 лет, село, бедный, не доверяет Путину, не доверяет Думе, не влияет на жизнь.
Не голосует: низкое образование и доход, недоверие, молодежь, город.

Идеи дальнейших исследований:
Позиции партий – сознательное поведение (равновесие Нэша).
Влияние изменения экономического положения за последние годы.