Содержание

Слайд 2

COST N 2 Если это так, разумно исследовать, применима ли одна

COST

N

2

Если это так, разумно исследовать, применима ли одна модель регрессии к

обоим категориям или нужны ли вам отдельные для них. Для этого вы можете выполнить тест Chow

ТЕСТ ЧОУ

Слайд 3

3 Мы проиллюстрируем это, используя данные для 74 средних школ в

3

Мы проиллюстрируем это, используя данные для 74 средних школ в Шанхае.

Диаграмма разброса отображает данные о годовых периодических расходах и числе студентов.

ТЕСТ ЧОУ

COST

N

Слайд 4

. reg COST N Source | SS df MS Number of

. reg COST N
Source | SS df MS Number of

obs = 74
---------+------------------------------ F( 1, 72) = 46.82
Model | 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000
Residual | 8.9160e+11 72 1.2383e+10 R-squared = 0.3940
---------+------------------------------ Adj R-squared = 0.3856
Total | 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05
------------------------------------------------------------------------------
COST | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 339.0432 49.55144 6.842 0.000 240.2642 437.8222
_cons | 23953.3 27167.96 0.882 0.381 -30205.04 78111.65
------------------------------------------------------------------------------

4

Вот результат регрессии, когда COST регрессируется на N, не делая различия между различными типами школ.

ТЕСТ ЧОУ

Слайд 5

5 Это диаграмма рассеяния с линией регрессии ТЕСТ ЧОУ COST N

5

Это диаграмма рассеяния с линией регрессии

ТЕСТ ЧОУ

COST

N

Слайд 6

6 Теперь мы проводим различие между профессиональными школами и обычными школами

6

Теперь мы проводим различие между профессиональными школами и обычными школами и

проводим отдельные регрессии для двух подвыборки

ТЕСТ ЧОУ

Профессиональные школы

Обычные школы

COST

N

Слайд 7

. reg COST N if OCC==1 Source | SS df MS

. reg COST N if OCC==1
Source | SS df MS

Number of obs = 34
---------+------------------------------ F( 1, 32) = 55.52
Model | 6.0538e+11 1 6.0538e+11 Prob > F = 0.0000
Residual | 3.4895e+11 32 1.0905e+10 R-squared = 0.6344
---------+------------------------------ Adj R-squared = 0.6229
Total | 9.5433e+11 33 2.8919e+10 Root MSE = 1.0e+05
------------------------------------------------------------------------------
COST | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 436.7769 58.62085 7.451 0.000 317.3701 556.1836
_cons | 47974.07 33879.03 1.416 0.166 -21035.26 116983.4
------------------------------------------------------------------------------

7

Это результат регрессии, когда COST регрессируется на N, используя подвыборку из 34 профессиональных школ.

ТЕСТ ЧОУ

Слайд 8

. reg COST N if OCC==0 Source | SS df MS

. reg COST N if OCC==0
Source | SS df MS

Number of obs = 40
---------+------------------------------ F( 1, 38) = 13.53
Model | 4.3273e+10 1 4.3273e+10 Prob > F = 0.0007
Residual | 1.2150e+11 38 3.1973e+09 R-squared = 0.2626
---------+------------------------------ Adj R-squared = 0.2432
Total | 1.6477e+11 39 4.2249e+09 Root MSE = 56545
------------------------------------------------------------------------------
COST | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
N | 152.2982 41.39782 3.679 0.001 68.49275 236.1037
_cons | 51475.25 21599.14 2.383 0.022 7750.064 95200.43
------------------------------------------------------------------------------

8

И это результат регрессии, когда COST регрессируется на N для подвыборки из 40 обычных школ.

ТЕСТ ЧОУ

Слайд 9

9 Вот регрессионные линии для двух подвыборки ТЕСТ ЧОУ Профессиональные школы Обычные школы COST N

9

Вот регрессионные линии для двух подвыборки

ТЕСТ ЧОУ

Профессиональные школы

Обычные школы

COST

N

Слайд 10

10 Для сравнения показана линия регрессии для объединенного образца (целая выборка,

10

Для сравнения показана линия регрессии для объединенного образца (целая выборка, без

какого-либо различия).

ТЕСТ ЧОУ

Профессиональные школы

Обычные школы

COST

N

Слайд 11

11 ТЕСТ ЧОУ RSS = 5.55 x 1011 COST N Обычные

11

ТЕСТ ЧОУ

RSS = 5.55 x 1011

COST

N

Обычные школы

Профессиональные школы

На диаграмме показаны остатки

для профессиональных школ в регрессии с использованием объединенного образца
Слайд 12

12 ТЕСТ ЧОУ COST N Обычные школы Профессиональные школы Теперь соответствующие

12

ТЕСТ ЧОУ

COST

N

Обычные школы

Профессиональные школы

Теперь соответствующие остатки для регрессии с использованием только

выборочных наблюдений в оккупационных школах

RSS = 3.49 x 1011

Слайд 13

13 ТЕСТ ЧОУ COST N Обычные школы Профессиональные школы RSS меньше

13

ТЕСТ ЧОУ

COST

N

Обычные школы

Профессиональные школы

RSS меньше для остатков от подвыборной регрессии. Это

должно быть так. Зачем? (Попробуйте ответить, прежде чем продолжить.)

RSS = 3.49 x 1011

Слайд 14

14 ТЕСТ ЧОУ COST N Обычные школы Проф. школы Линия регрессии

14

ТЕСТ ЧОУ

COST

N

Обычные школы

Проф. школы

Линия регрессии для подвыборной регрессии расположена так, чтобы

минимизировать сумму квадратов остатков для наблюдений в школе. Это принцип, лежащий в основе OLS.

RSS = 3.49 x 1011

Слайд 15

15 ТЕСТ ЧОУ Линия регрессии для объединенного образца расположена для обеспечения

15

ТЕСТ ЧОУ

Линия регрессии для объединенного образца расположена для обеспечения наилучшего общего

соответствия для образца в целом, включая обычные школы

COST

N

Обычные школы

Проф. школы

RSS = 5.55 x 1011

Слайд 16

16 ТЕСТ ЧОУ Поэтому его местоположение является компромиссом между наилучшим подходом

16

ТЕСТ ЧОУ

Поэтому его местоположение является компромиссом между наилучшим подходом к наблюдениям

в профессиональной школе и наилучшим образом подходит для обычных школьных наблюдений. Поскольку это компромисс, его подгонка будет ниже, чем для регрессии подвыборки

COST

N

Обычные школы

Проф. школы

RSS = 5.55 x 1011

Слайд 17

17 Затем мы переходим к обычным школам. Вот остатки для объединенной

17

Затем мы переходим к обычным школам. Вот остатки для объединенной регрессии.

ТЕСТ

ЧОУ

COST

Обычные школы

Проф. школы

N

RSS = 3.36 x 1011

Слайд 18

18 ТЕСТ ЧОУ COST Обычные школы Проф. школы N Затем мы

18

ТЕСТ ЧОУ

COST

Обычные школы

Проф. школы

N

Затем мы переходим к обычным школам. Вот остатки

для объединенной регрессии

RSS = 1.22 x 1011

Слайд 19

19 ТЕСТ ЧОУ COST Обычные школы Проф. школы N Опять же,

19

ТЕСТ ЧОУ

COST

Обычные школы

Проф. школы

N

Опять же, RSS должен быть ниже для регрессии

подвыборки, чем для объединенной регрессии выборки.

RSS = 1.22 x 1011

Слайд 20

20 В таблице приведены данные RSS для двух типов школ в

20

В таблице приведены данные RSS для двух типов школ в отдельных

и объединенных регрессиях.

ТЕСТ ЧОУ
Остаточная сумма квадратов (x1011)
Регрессия Профессиональная Обычная Всего
Отдельный RSS1 = 3.49 RSS2 = 1.22 4.71
Объединенный 5.55 3.36 RSSP = 8.91

Слайд 21

21 Остаточные суммы квадратов для отдельных регрессий для профессиональных и обычных

21

Остаточные суммы квадратов для отдельных регрессий для профессиональных и обычных школ

будут обозначаться соответственно RSS1 и RSS2

ТЕСТ ЧОУ
Остаточная сумма квадратов(x1011)
Регрессия Профессиональная Обычная Всего
Отдельный RSS1 = 3.49 RSS2 = 1.22 4.71
Объединненный 5.55 3.36 RSSP = 8.91

Слайд 22

22 Добавляя их вместе, мы получаем общую остаточную сумму квадратов, когда

22

Добавляя их вместе, мы получаем общую остаточную сумму квадратов, когда для

двух подвыборки выполняются отдельные регрессии.

ТЕСТ ЧОУ
Остаточная сумма квадратов (x1011)
Регрессия Профессиональная Обычная Всего
Отдельные RSS1 = 3.49 RSS2 = 1.22 4.71
Объединненные 5.55 3.36 RSSP = 8.91

Слайд 23

23 Мы сравниваем эту сумму с RSSP, остаточной суммой квадратов из

23

Мы сравниваем эту сумму с RSSP, остаточной суммой квадратов из объединенной

регрессии выборки.

ТЕСТ ЧОУ
Остаточная сумма квадратов(x1011)
Регрессия Профессиональный Обычная Всего
Отдельные RSS1 = 3.49 RSS2 = 1.22 4.71
Объединенные 5.55 3.36 RSSP = 8.91

Слайд 24

24 Это получается непосредственно из исходной регрессии. Нет необходимости вычислять профессиональные

24

Это получается непосредственно из исходной регрессии. Нет необходимости вычислять профессиональные и

регулярные компоненты. Нас интересует только итог.

ТЕСТ ЧОУ

COST

N

Обычные школы

Проф. школы

RSS = 8.91 x 1011

Слайд 25

25 Мы заинтересованы в том, чтобы добиться существенного уменьшения общего количества,

25

Мы заинтересованы в том, чтобы добиться существенного уменьшения общего количества, когда

мы выполняем отдельные регрессии для двух подвыборки.

ТЕСТ ЧОУ
Остаточная сумма квадратов (x1011)
Регрессия Профессиональная Обычная Всего
Отдельные RSS1 = 3.49 RSS2 = 1.22 4.71
Объединенные 5.55 3.36 RSSP = 8.91

Слайд 26

26 Статистика теста - это статистика F, определенная как показано ТЕСТ

26

Статистика теста - это статистика F, определенная как показано

ТЕСТ ЧОУ

F(k, n

– 2k)

общее снижение в RSS, когда
выполняются отдельные регрессии

стоимость в степени
свободы

степеней свободы
осталось

общее количество оставшихся RSS
выполняются отдельные регрессии

Слайд 27

27 Первым аргументом статистики F является k, стоимость, с точки зрения

27

Первым аргументом статистики F является k, стоимость, с точки зрения степеней

свободы, выполнения отдельных регрессий.

ТЕСТ ЧОУ

F(k, n – 2k)

общее снижение в RSS, когда
выполняются отдельные регрессии

стоимость в степени
свободы

общее количество оставшихся RSS
выполняются отдельные регрессии

степеней свободы
осталось

Слайд 28

28 Стоимость k, поскольку два набора k параметров оцениваются при выполнении

28

Стоимость k, поскольку два набора k параметров оцениваются при выполнении отдельных

регрессий, а не только один набор с объединенной регрессией.

ТЕСТ ЧОУ

F(k, n – 2k)

общее снижение в RSS, когда
выполняются отдельные регрессии

стоимость в степени
свободы

общее количество оставшихся RSS
выполняются отдельные регрессии

степеней свободы
осталось

Слайд 29

29 Второй аргумент статистики F - n - 2k, общее число

29

Второй аргумент статистики F - n - 2k, общее число степеней

свободы, оставшихся при выполнении отдельных регрессий.

ТЕСТ ЧОУ

F(k, n – 2k)

общее снижение в RSS, когда
выполняются отдельные регрессии

стоимость в степени
свободы

общее количество оставшихся RSS
выполняются отдельные регрессии

степеней свободы
осталось

Слайд 30

30 По каждой регрессии, когда проводятся отдельные регрессии, есть n наблюдений

30

По каждой регрессии, когда проводятся отдельные регрессии, есть n наблюдений и

k степеней свободы.

ТЕСТ ЧОУ

F(k, n – 2k)

общее снижение в RSS, когда
выполняются отдельные регрессии

общее количество оставшихся RSS
выполняются отдельные регрессии

стоимость в степени
свободы

степеней свободы
осталось

Слайд 31

F(k, n – 2k) 31 Числитель F-статистики состоит из общего улучшения

F(k, n – 2k)

31

Числитель F-статистики состоит из общего улучшения пригонки

при расщеплении образца, деленного на стоимость в терминах степеней свободы при выполнении отдельных регрессий.

ТЕСТ ЧОУ

общее снижение в RSS, когда
выполняются отдельные регрессии

стоимость в степени
свободы

общее количество оставшихся RSS
выполняются отдельные регрессии

степеней свободы
осталось

Слайд 32

F(k, n – 2k) 32 Знаменателем F-статистики является общее количество RSS,

F(k, n – 2k)

32

Знаменателем F-статистики является общее количество RSS, оставшееся

после расщепления выборки, деленное на количество оставшихся степеней свободы

ТЕСТ ЧОУ

общее снижение в RSS, когда
выполняются отдельные регрессии

стоимость в степени
свободы

общее количество оставшихся RSS
выполняются отдельные регрессии

степеней свободы
осталось

Слайд 33

F(k, n – 2k) RSSP = 8.91 x 1011 RSS1 +

F(k, n – 2k)

RSSP = 8.91 x 1011

RSS1 + RSS2

= 4.71 x 1011

33

В случае функций стоимости школы сокращение остаточной суммы квадратов уже было сведено в таблицу.

ТЕСТ ЧОУ

общее снижение в RSS, когда
выполняются отдельные регрессии

стоимость в степени
свободы

общее количество оставшихся RSS
выполняются отдельные регрессии

степеней свободы
осталось

Слайд 34

F(k, n – 2k) RSSP = 8.91 x 1011 RSS1 +

F(k, n – 2k)

RSSP = 8.91 x 1011

RSS1 + RSS2

= 4.71 x 1011

34

В модели только два параметра: константа и коэффициент N, поэтому первый аргумент статистики F равен 2

ТЕСТ ЧОУ

общее снижение в RSS, когда
выполняются отдельные регрессии

общее количество оставшихся RSS
выполняются отдельные регрессии

стоимость в степени
свободы

степеней свободы
осталось

Слайд 35

F(k, n – 2k) RSSP = 8.91 x 1011 RSS1 +

F(k, n – 2k)

RSSP = 8.91 x 1011

RSS1 + RSS2

= 4.71 x 1011

35

Остаточная сумма квадратов, оставшихся после расщепления образца, представляет собой сумму RSS1 и RSS2.

ТЕСТ ЧОУ

общее снижение в RSS, когда
выполняются отдельные регрессии

общее количество оставшихся RSS
выполняются отдельные регрессии

стоимость в степени
свободы

степеней свободы
осталось

Слайд 36

37 Таким образом, статистика F равна 31.2. Критическое значение F (2,70)

37

Таким образом, статистика F равна 31.2. Критическое значение F (2,70) составляет

7,6 при уровне значимости 0,1%.

ТЕСТ ЧОУ

F(k, n – 2k)

RSSP = 8.91 x 1011

RSS1 + RSS2 = 4.71 x 1011

общее снижение в RSS, когда
выполняются отдельные регрессии

стоимость в степени
свободы

общее количество оставшихся RSS
выполняются отдельные регрессии

степеней свободы
осталось