Diagnostika lineárního regresního modelu

Содержание

Слайд 2

Postup tvorby lineárního modelu 1. Návrh modelu (začíná se od nejjednoduššího)

Postup tvorby lineárního modelu

1. Návrh modelu (začíná se od nejjednoduššího)
2. Předběžná

analýza dat (sleduje se proměnlivost jednotlivých proměnných a možné párové vztahy)
3. Odhadování parametrů modelu (metodou MNČ)
4. Regresní diagnostika (identifikace odlehlých pozorování a ověření předpokladů MNČ)
5. Konstrukce zpřesněného modelu
6. Zhodnocení kvality modelu (testy, regresní diagnostika nového modelu)
Слайд 3

Regresní diagnostika Regresní diagnostika obsahuje postupy k posouzení: ∙ kvality dat kvality modelu splnění předpokladů

Regresní diagnostika

Regresní diagnostika obsahuje postupy k posouzení:
∙ kvality dat
kvality modelu
splnění předpokladů

Слайд 4

Diagnostika kvality dat Vlivné body lze rozdělit do tří skupin Hrubé

Diagnostika kvality dat
Vlivné body lze rozdělit do tří skupin
Hrubé chyby
Body s

vysokým vlivem
Zdánlivě vlivné body
Слайд 5

Diagnostika kvality dat Podle polohy rozlišujeme vlivné body na: vybočující pozorování

Diagnostika kvality dat


Podle polohy rozlišujeme vlivné body na:
vybočující pozorování (outliers)
extrémy

(leverage points)
Ve statistických programech se na rozdíl od odborné statistické literatury nerozlišují vybočující
pozorování a extrémy a obecně se hovoří od
odlehlých pozorováních
Слайд 6

Diagnostika kvality dat Nejednoduší grafické vyjádření odlehlých pozorování Graf predikovaných reziduí

Diagnostika kvality dat

Nejednoduší grafické vyjádření odlehlých pozorování
Graf predikovaných reziduí
Osa

y – klasická rezidua
Osa x – predikovaná rezidua
O - vybočující bod (leží na
přímce nebo v její blízkosti,
ale daleko od ostáních bodů)
E – extrémní bod (leží mimo přímku)
Слайд 7

Diagnostika kvality dat Projekční matice H (hat matrix) Studentizovaná rezidua Odlehlost neznamená vlivnost!!!

Diagnostika kvality dat
Projekční matice H (hat matrix)
Studentizovaná rezidua
Odlehlost neznamená vlivnost!!!

Слайд 8

Diagnostika kvality dat Míra vlivu kombinace proměnných x a y Cookova

Diagnostika kvality dat

Míra vlivu kombinace proměnných x a y
Cookova D veličina
Míra

vlivu jednotlivých pozorování
Welshova-Kuhova vzdálenost DFFIT(-i).
Слайд 9

Diagnostika kvality dat Požadavky kladené na rezidua reziduum ei = yi

Diagnostika kvality dat

Požadavky kladené na rezidua
reziduum ei = yi –

yi´
mají nulovou střední hodnotu E(ei) = 0 a konstantní rozptyl E(ei2) = σ2
jsou nekorelované (jsou nezávislé)
jsou náhodná mají normální rozdělení
Слайд 10

Diagnostika kvality dat Rezidua jsou nekorelované - posouzení podmínky o nezávislosti

Diagnostika kvality dat
Rezidua jsou nekorelované - posouzení podmínky
o  nezávislosti reziduí

se provádí pomoci
Durbin-Watsonova statistiky. Vzájemná závislost
reziduí může naznačovat autokorelaci
Слайд 11

Diagnostika kvality dat Posouzení podmínky o náhodnosti reziduí se provádí pomocí testů normality reziduí nebo graficky.

Diagnostika kvality dat
Posouzení podmínky o náhodnosti reziduí se
provádí pomocí testů

normality reziduí nebo
graficky.
Слайд 12

Diagnostika kvality dat Grafická analýza reziduí Pokud se v diagnostických grafech

Diagnostika kvality dat

Grafická analýza reziduí
Pokud se v diagnostických grafech reziduí objeví


tvar „mraku“ bodů, je detekována správnost metody
nejmenších čtverců.
Слайд 13

Diagnostika kvality dat Jiné obrazce bodů v grafu reziduí indikují většinou

Diagnostika kvality dat

Jiné obrazce bodů v grafu reziduí indikují většinou
nesprávnost

v datech či nesprávnost modelu.
Tvar výseče odhaluje nekonstantnost rozptylu čili
heteroskedasticitu v datech (megafonový efekt).
Слайд 14

Diagnostika kvality dat Tvar pásu indikuje chybu ve výpočtu nebo se

Diagnostika kvality dat

Tvar pásu indikuje chybu ve výpočtu nebo se jedná

o
důsledek vybočujících hodnot. Může také indikovat
chybný výpočet a nebo to, že kdy v regresní modelu
chybí absolutní člen.
Слайд 15

Diagnostika kvality dat Nelineární tvar ukazuje na nesprávně navržený model. Analýza

Diagnostika kvality dat

Nelineární tvar ukazuje na nesprávně navržený
model.
Analýza reziduí

a její grafické znázornění, nám také
může sloužit k první identifikaci odlehlých pozorování.
Слайд 16

Diagnostika kvality modelu Kritika a analýza modelu jako celku Kvalitu regresního

Diagnostika kvality modelu

Kritika a analýza modelu jako celku
Kvalitu regresního modelu

lze posoudit graficky či numericky.
V případě jedné vysvětlující proměnné x přímo z rozptylového grafu závislosti y na x.
Numericky s využitím klasických testů (např.:F- test, t-test) a postupů regresní diagnostiky.
Слайд 17

Diagnostika metody odhadů Splnění předpokladů MNČ Regresní parametry β mohou teoreticky

Diagnostika metody odhadů

Splnění předpokladů MNČ
Regresní parametry β mohou teoreticky nabývat jakýchkoli

hodnot.
Regresní model je lineární v parametrech.
Nezávislé proměnné x jsou skutečně vzájemně
nezávislé.
Podmíněný rozptyl D(y/x) = σ2 je konstantní.
Náhodné chyby εi mají nulovou střední hodnotu, konečný a konstantní rozptyl a jsou nekorelované.