Точность расчетной модели

Содержание

Слайд 2

2 Остаток в любом наблюдении определяется разницей между фактическим и расчетным

2

Остаток в любом наблюдении определяется разницей между фактическим и расчетным значениями

Y для этого наблюдения.

Точность расчетной модели

Два полезных результата:

Слайд 3

3 Вначале заменим расчетное значение выражением для него. Точность расчетной модели Два полезных результата:

3

Вначале заменим расчетное значение выражением для него.

Точность расчетной модели

Два полезных

результата:
Слайд 4

4 Просуммируем все наблюдения. Точность расчетной модели Два полезных результата:

4

Просуммируем все наблюдения.

Точность расчетной модели

Два полезных результата:

Слайд 5

5 Разделив на n, мы получим среднее значение остатков, выраженное через

5

Разделив на n, мы получим среднее значение остатков, выраженное через значения

X, Y и коэффициенты регрессии.

Точность расчетной модели

Два полезных результата:

Слайд 6

6 Если мы заменим b1, выражение будет равно нулю. Два полезных результата: Точность расчетной модели

6

Если мы заменим b1, выражение будет равно нулю.

Два полезных результата:

Точность расчетной

модели
Слайд 7

7 Этот результат можно записать в другом виде: сумма остатков должна

7

Этот результат можно записать в другом виде: сумма остатков должна быть

равна нулю.

Точность расчетной модели

Два полезных результата:

Слайд 8

8 Из этого результата следует, что среднее значение расчетных значений Y

8

Из этого результата следует, что среднее значение расчетных значений Y равно

среднему значению фактических значений Y.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 9

9 Опять начнем с определения остатка. Точность расчетной модели Два полезных результата: Дальнейшие результаты:

9

Опять начнем с определения остатка.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 10

10 Просуммируем все наблюдения. Точность расчетной модели Два полезных результата: Дальнейшие результаты:

10

Просуммируем все наблюдения.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 11

11 В левой части сумма остатков равна нулю. Теперь выражение разделим

11

В левой части сумма остатков равна нулю. Теперь выражение разделим на

n.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 12

Следовательно, среднее значение расчетных значений равно среднему значению фактических значений. 12

Следовательно, среднее значение расчетных значений равно среднему значению фактических значений.

12

Точность расчетной

модели

Два полезных результата:

Дальнейшие результаты:

Слайд 13

13 Далее покажем, что сумма произведений значений X и остатков равна

13

Далее покажем, что сумма произведений значений X и остатков равна нулю.

Точность

расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 14

14 Начнем с замены остатка его выражением через Y и X.

14

Начнем с замены остатка его выражением через Y и X.

Точность расчетной

модели

Два полезных результата:

Дальнейшие результаты:

Слайд 15

15 Упростим выражение. Точность расчетной модели Два полезных результата: Дальнейшие результаты:

15

Упростим выражение.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 16

16 Выражение равно нулю. Одним из способов продемонстрировать это: заменить b1

16

Выражение равно нулю. Одним из способов продемонстрировать это: заменить b1 и

b2 и показать, что все слагаемые сокращаются.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 17

17 Точный способ - вспомнить условие первого порядка для b2 при

17

Точный способ - вспомнить условие первого порядка для b2 при выводе

коэффициентов регрессии. Вы можете видеть, что так оно и есть.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 18

18 Наконец, побочным результатом нашего последнего расчета, является равенство нулю суммы

18

Наконец, побочным результатом нашего последнего расчета, является равенство нулю суммы произведений

расчетных значений Y и остатков.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 19

19 Сначала подставим расчетные значения Y. Точность расчетной модели Два полезных результата: Дальнейшие результаты:

19

Сначала подставим расчетные значения Y.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 20

20 Производим расчеты. Точность расчетной модели Два полезных результата: Дальнейшие результаты:

20

Производим расчеты.

Точность расчетной модели

Два полезных результата:

Дальнейшие результаты:

Слайд 21

21 Выражение равно нулю, учитывая ранее полученные результаты. Точность расчетной модели Два полезных результата: Дальнейшие результаты:

21

Выражение равно нулю, учитывая ранее полученные результаты.

Точность расчетной модели

Два полезных результата:

Дальнейшие

результаты:
Слайд 22

22 Мерой вариации Y является сумма его квадратов отклонений от среднего

22

Мерой вариации Y является сумма его квадратов отклонений от среднего значения

выборки. Это называется общей суммой квадратов TSS.

Точность расчетной модели

Слайд 23

23 Мы разложим общую сумму квадратов, используя тот факт, что фактическое

23

Мы разложим общую сумму квадратов, используя тот факт, что фактическое значение

Y в любом наблюдении равно сумме его расчетного значения и остатка.

Точность расчетной модели

Слайд 24

24 Подставим Yi. Точность расчетной модели

24

Подставим Yi.

Точность расчетной модели

Слайд 25

25 Перегруппируем члены. Точность расчетной модели

25

Перегруппируем члены.

Точность расчетной модели

Слайд 26

26 Разложим квадрат в правой части уравнения. Точность расчетной модели

26

Разложим квадрат в правой части уравнения.

Точность расчетной модели

Слайд 27

27 Разложим третий член в правой части уравнения. Точность расчетной модели

27

Разложим третий член в правой части уравнения.

Точность расчетной модели

Слайд 28

28 Последние два члена равны нулю, учитывая ранее полученные результаты. Точность расчетной модели

28

Последние два члена равны нулю, учитывая ранее полученные результаты.

Точность расчетной модели

Слайд 29

29 Мы показали, что TSS, общая сумма квадратов Y может быть

29

Мы показали, что TSS, общая сумма квадратов Y может быть разложена

на ESS, объяснённую сумму квадратов, и RSS, сумму квадратов остатков.

ESS, explained sum of squares

Точность расчетной модели

TSS, total sum of squares

RSS, residual sum of squares

Слайд 30

Слова, «объясненные» и «необъяснимые», заключены в кавычки, потому что объяснение может

Слова, «объясненные» и «необъяснимые», заключены в кавычки, потому что объяснение может

быть ложным. Y может действительно зависеть от некоторой другой переменной Z, а X может выступать в качестве замены для Z.

30

Точность расчетной модели

ESS, explained sum of squares

TSS, total sum of squares

RSS, residual sum of squares

Слайд 31

Правильнее, «явно объясненные» вместо «объясненные». 31 Точность расчетной модели ESS, explained

Правильнее, «явно объясненные» вместо «объясненные».

31

Точность расчетной модели

ESS, explained sum of squares

TSS,

total sum of squares

RSS, residual sum of squares

Слайд 32

32 Основным критерием точности расчетной модели является коэффициент детерминации R2, определяемый

32

Основным критерием точности расчетной модели является коэффициент детерминации R2, определяемый как

отношение ESS к TSS, то есть часть дисперсии Y, объясняемая уравнением регрессии.

Точность расчетной модели

Слайд 33

33 Статистика для регрессии почасового заработка по годам обучения. Точность расчетной

33

Статистика для регрессии почасового заработка по годам обучения.

Точность расчетной модели

. reg

EARNINGS S
Source | SS df MS Number of obs = 540
-------------+------------------------------ F( 1, 538) = 112.15
Model | 19321.5589 1 19321.5589 Prob > F = 0.0000
Residual | 92688.6722 538 172.283777 R-squared = 0.1725
-------------+------------------------------ Adj R-squared = 0.1710
Total | 112010.231 539 207.811189 Root MSE = 13.126
------------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
S | 2.455321 .2318512 10.59 0.000 1.999876 2.910765
_cons | -13.93347 3.219851 -4.33 0.000 -20.25849 -7.608444
------------------------------------------------------------------------------
Слайд 34

34 Заголовок столбца «SS» обозначает суммы квадратов. ESS, названная как «модельная»

34

Заголовок столбца «SS» обозначает суммы квадратов. ESS, названная как «модельная» сумма

квадратов, составляет 19322. TSS составляет 112010.

Точность расчетной модели

. reg EARNINGS S
Source | SS df MS Number of obs = 540
-------------+------------------------------ F( 1, 538) = 112.15
Model | 19321.5589 1 19321.5589 Prob > F = 0.0000
Residual | 92688.6722 538 172.283777 R-squared = 0.1725
-------------+------------------------------ Adj R-squared = 0.1710
Total | 112010.231 539 207.811189 Root MSE = 13.126
------------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
S | 2.455321 .2318512 10.59 0.000 1.999876 2.910765
_cons | -13.93347 3.219851 -4.33 0.000 -20.25849 -7.608444
------------------------------------------------------------------------------

Слайд 35

35 Разделив ESS на TSS, мы имеем R2 = 19,322 /

35

Разделив ESS на TSS, мы имеем R2 = 19,322 / 112,010

= 0.1725, как указано в верхнем правом углу слайда.

Точность расчетной модели

. reg EARNINGS S
Source | SS df MS Number of obs = 540
-------------+------------------------------ F( 1, 538) = 112.15
Model | 19321.5589 1 19321.5589 Prob > F = 0.0000
Residual | 92688.6722 538 172.283777 R-squared = 0.1725
-------------+------------------------------ Adj R-squared = 0.1710
Total | 112010.231 539 207.811189 Root MSE = 13.126
------------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
S | 2.455321 .2318512 10.59 0.000 1.999876 2.910765
_cons | -13.93347 3.219851 -4.33 0.000 -20.25849 -7.608444
------------------------------------------------------------------------------

Слайд 36

36 Низкий R2 частично объясняется тем, что в модели отсутствуют важные

36

Низкий R2 частично объясняется тем, что в модели отсутствуют важные переменные,

такие как опыт работы.

Точность расчетной модели

. reg EARNINGS S
Source | SS df MS Number of obs = 540
-------------+------------------------------ F( 1, 538) = 112.15
Model | 19321.5589 1 19321.5589 Prob > F = 0.0000
Residual | 92688.6722 538 172.283777 R-squared = 0.1725
-------------+------------------------------ Adj R-squared = 0.1710
Total | 112010.231 539 207.811189 Root MSE = 13.126
------------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
S | 2.455321 .2318512 10.59 0.000 1.999876 2.910765
_cons | -13.93347 3.219851 -4.33 0.000 -20.25849 -7.608444
------------------------------------------------------------------------------

Слайд 37

37 Это также частично объясняется тем фактом, что ненаблюдаемые характеристики важны

37

Это также частично объясняется тем фактом, что ненаблюдаемые характеристики важны для

определения зарплаты, R2 редко намного превышает 0,5 даже в хорошо определенной модели.

Точность расчетной модели

. reg EARNINGS S
Source | SS df MS Number of obs = 540
-------------+------------------------------ F( 1, 538) = 112.15
Model | 19321.5589 1 19321.5589 Prob > F = 0.0000
Residual | 92688.6722 538 172.283777 R-squared = 0.1725
-------------+------------------------------ Adj R-squared = 0.1710
Total | 112010.231 539 207.811189 Root MSE = 13.126
------------------------------------------------------------------------------
EARNINGS | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
S | 2.455321 .2318512 10.59 0.000 1.999876 2.910765
_cons | -13.93347 3.219851 -4.33 0.000 -20.25849 -7.608444
------------------------------------------------------------------------------

Слайд 38

38 Мы хотим построить уравнение регрессии так, чтобы точность была максимально

38

Мы хотим построить уравнение регрессии так, чтобы точность была максимально возможной

согласно R2 . Возможно ли это при определении b1 и b2 с помощью метода наименьших квадратов?

Точность расчетной модели

Слайд 39

39 Чтобы увидеть это, перепишите выражение для R2 в терминах RSS. Точность расчетной модели

39

Чтобы увидеть это, перепишите выражение для R2 в терминах RSS.

Точность расчетной

модели
Слайд 40

40 При МНК коэффициенты регрессии выбираются таким образом, чтобы минимизировать сумму

40

При МНК коэффициенты регрессии выбираются таким образом, чтобы минимизировать сумму квадратов

остатков. Из этого автоматически следует, что они максимизируют R2.

Точность расчетной модели

Слайд 41

Другим критерием точности является корреляция между фактическими и расчетными значениями Y.

Другим критерием точности является корреляция между фактическими и расчетными значениями Y.

Если для расчета коэффициентов регрессии используется МНК, то точность расчетной модели становится максимальной.

41

Точность расчетной модели

Слайд 42

Заменим фактическое значение Y в первом сомножителе. 42 Точность расчетной модели

Заменим фактическое значение Y в первом сомножителе.

42

Точность расчетной модели

Слайд 43

Делаем перестановки. 43 Точность расчетной модели

Делаем перестановки.

43

Точность расчетной модели

Слайд 44

Разложим выражение. Последние два члена равны нулю. 44 Точность расчетной модели

Разложим выражение. Последние два члена равны нулю.

44

Точность расчетной модели

Слайд 45

Таким образом, числитель равен сумме квадратов отклонений расчетных значений Y от

Таким образом, числитель равен сумме квадратов отклонений расчетных значений Y от

среднего значения Y.

45

Точность расчетной модели

Слайд 46

Мы имеем то же выражение под квадратным корнем в знаменателе. Следовательно,

Мы имеем то же выражение под квадратным корнем в знаменателе. Следовательно,

это выражение под квадратным корнем остается в числителе.

46

Точность расчетной модели