Mnohonásobná lineární regrese a korelace

Содержание

Слайд 2

Mnohonásobná korelace Mnohonásobná korelační závislost nám umožňuje sledovat, jak závisí proměnná

Mnohonásobná korelace
Mnohonásobná korelační závislost nám umožňuje sledovat, jak závisí proměnná y

nejen
na vysvětlující proměnné x1, ale také na dalších proměnných x2,x3 …, xk.
Koeficient párový
Koeficient vícenásobné (totální) korelace
Koeficient dílčí (parciální) korelace
Слайд 3

Mnohonásobná korelace Sílu jednoduché lineární závislosti mezi jednou závisle proměnnou y

Mnohonásobná korelace


Sílu jednoduché lineární závislosti mezi jednou závisle proměnnou y a

jedou vysvětlující proměnnou x udávají:
Párové korelační koeficienty
Слайд 4

Mnohonásobná korelace Párové korelační koeficienty

Mnohonásobná korelace

Párové korelační koeficienty

Слайд 5

Párové korelační koeficienty

Párové korelační koeficienty

Слайд 6

Mnohonásobná korelace Koeficienty dílčí (parciální) korelace charakterizuje sílu lineární závislosti mezi

Mnohonásobná korelace

Koeficienty dílčí (parciální) korelace
charakterizuje sílu lineární závislosti mezi závisle


proměnnou a jednou nezávisle proměnnou, jsou-li
hodnoty zbývajících proměnných v modelu konstantní.
parciální korelační koeficient mezi y a x1
s vyloučením vlivu x2 (při konstantním vlivu x2).
Слайд 7

Mnohonásobná korelace Parciální korelační koeficienty

Mnohonásobná korelace

Parciální korelační koeficienty

Слайд 8

Koeficienty dílčí korelace Příklad ⇒ vyjadřuje závislost celkové produkce na provozních

Koeficienty dílčí korelace

Příklad ⇒ vyjadřuje závislost celkové produkce na
provozních nákladech

za předpokladu, že výrobní
spotřeba, odpisy a provozní dotace jsou neméně.

Konstantní
proměnné

Слайд 9

Mnohonásobná korelace Sílu vztahu závisle proměnné y na všech vysvětlujících proměnných

Mnohonásobná korelace

Sílu vztahu závisle proměnné y na všech vysvětlujících proměnných x

udává:
Koeficient vícenásobné (totální) korelace R
(1 znamená úplnou závislost a hodnota 0 nezávislost ).
Слайд 10

Koeficient totální korelace Příklad ⇒ vyjadřuje závislost celkové produkce na všech

Koeficient totální korelace

Příklad ⇒ vyjadřuje závislost celkové produkce na všech

prediktorech (nezávisle proměnných).

Koeficient mnohonásobné korelace R

Opravená hodnota R2 (adjusted R2) nebere v úvahu stupně volnosti, proto je vždy v modelu s větším počtem vysvětlujících proměnných vyšší hodnota R2. Potřebujeme-li porovnat kvalitu modelů s různým počtem vysvětlujících proměnných pro stejnou vysvětlovanou proměnnou y, použijeme opravenou hodnotu.

Koeficient mnohonásobné determinace R2

Слайд 11

Mnohonásobná regrese Mnohonásobná regresní analýza je metoda, pro modelování závislostí několika

Mnohonásobná regrese

Mnohonásobná regresní analýza je metoda,
pro modelování závislostí několika vysvětlovaných
náhodných

veličin (závisle proměnných) Y1, Y2, .. YG
na jedné nebo několika vysvětlujících veličinách
(nezávisle proměnných) X1, X2, .. XK.
Слайд 12

Mnohonásobná regrese Cíle mnohonásobné regrese jsou stejné jako u regrese jednoduché:

Mnohonásobná regrese

Cíle mnohonásobné regrese jsou stejné jako u
regrese jednoduché:
vysvětlit

rozptyl v závisle proměnné Y
(pomocí R2);
odhadnout (vypočítat) vliv každé z nezávisle proměnných X na proměnnou závislou Y
(pomocí parciálních regresních koeficientů b);
3. predikovat pomocí sestavené regresní rovnice pro jednotlivé případy hodnoty závisle proměnné.
Слайд 13

Mnohonásobná regrese Před vlastní regresní analýzou je potřeba ověřit kvalitu dat.

Mnohonásobná regrese

Před vlastní regresní analýzou je potřeba ověřit kvalitu dat.
Samotné analýze

tedy musí předcházet podrobná diagnostika (analýza) vstupních proměnných (viz. 4. přednáška)
Слайд 14

Mnohonásobná regrese Model vyjadřující závislost veličiny Y na veličinách X1, X2

Mnohonásobná regrese

Model vyjadřující závislost veličiny Y na veličinách
X1, X2 ,

…, Xk lze zapsat ve tvaru:
yi = f(xi1, xi2 ,…, xik) + ε
kde: f (xi1,…., xik) … regresní funkce (i = 1, 2, …, n)
ε ……………… náhodná chyba.
Слайд 15

Mnohonásobná regrese Lineární vícenásobný regresní model Y = β0 + β1x1

Mnohonásobná regrese

Lineární vícenásobný regresní model
Y = β0 + β1x1 + β2x2

+ … + βkxk, + ε
β0, β1, β2, …, βk …..jsou neznámé parametry,
x1, …, xk …………..jsou vysvětlující proměnné,
ε …………………. náhodné chyby.
Koeficienty β0, β1, ….βK jsou obecně neznámé
parametry, které je třeba z výběru odhadnout pomocí MMČ.
Слайд 16

Mnohonásobná regrese Odhadnutou regresní funkci lze zapsat ve tvaru (MMČ) y`

Mnohonásobná regrese

Odhadnutou regresní funkci lze zapsat ve tvaru (MMČ)
y` =

b0 + b1x1 + b2x2 + …. + bkxk
b0 …….. je absolutní člen,
b1,..,bk... jsou dílčí parciální regresní koeficienty, které udávají změnu závisle proměnné y odpovídající jednotkové změně jedné nezávisle proměnné x, za předpokladu, že hodnoty zbývající nezávisle proměnných v modelu jsou konstantní.
(vyjadřují pouze část z vlivu, působících na vysvětlovanou proměnnou y)
Слайд 17

Mnohonásobná regrese Předpoklady modelu (viz. 4. přednáška) Vysvětlující proměnné musí být

Mnohonásobná regrese

Předpoklady modelu (viz. 4. přednáška)
Vysvětlující proměnné musí být

vzájemně
nezávislé – nesmí být korelované.
Náhodné chyby ε jsou nezávislé, normálně
rozdělené náhodné veličiny s nulovými středními
hodnotami a stejným rozptylem (homoskedascita).
Слайд 18

Hodnocení mnohonásob. modelu z hlediska testů významnosti Test významnosti dílčích výběrových

Hodnocení mnohonásob. modelu z hlediska testů významnosti


Test významnosti dílčích výběrových regresních

koeficient (parametrů b) provádíme pomocí
t – testů.
Test významnosti celého regresního modelu
se provádí pomocí upravené jednoduché ANOVY ⇒ F – testů
Слайд 19

Hodnocení mnohonásob. modelu z hlediska testů významnosti

Hodnocení mnohonásob. modelu z hlediska testů významnosti


Слайд 20

Příklad Sestavte nejvhodnější lineární regresní model pro závislost celkové produkce na

Příklad

Sestavte nejvhodnější lineární regresní model pro závislost celkové produkce na

provozních nákladech, výrobní spotřebě, odpisech a provozních dotacích.
y` = b0 + b1x1 + b2x2 + b3x3 + b4x4
y …… celková produkce
x1 …. .provozní náklady
x2 ….. výrobní spotřeba
x3……odpisy
x4 ……provozní dotace
Слайд 21

Příklad Metody výběru prediktorů

Příklad

Metody výběru prediktorů

Слайд 22

Metody výběru prediktorů (x) ENTER – všechny prediktory vstoupí do rovnice

Metody výběru prediktorů (x)
ENTER – všechny prediktory vstoupí do rovnice (rozhodnutí

uživatele).
1. metoda FORWARD – postupné zařazování prediktorů;
2. metoda BACKWARD – postupné vyřazování prediktorů;
3. metoda STEPWISE – kombinace obou, je založena na
postupném vstup bloků proměnných (prediktorů).
Слайд 23

Příklad Model jako celek je statistický významný vyplývá to z F-testu.

Příklad

Model jako celek je statistický významný vyplývá to z F-testu.

Totální korelační

koeficient - kvalita regresního odhadu;
hodnocení volby vysvětlujících proměnných.
Слайд 24

Příklad Z t-testů vyplývá, že některé regresní koeficienty jsou nevýznamné. I

Příklad

Z t-testů vyplývá, že některé regresní koeficienty jsou nevýznamné. I přesto,

že je model vhodný jako celek budeme pokračovat v modelování vztahu mezi proměnnými ⇒ provedeme korigaci modelu ⇒ vypuštění nevýznamných proměnných.
Слайд 25

Příklad Z úvodního posouzení modelu vyplynulo, že budeme provádět vypuštění proměnných.

Příklad

Z úvodního posouzení modelu vyplynulo, že budeme provádět vypuštění proměnných. V našem

případě – odpisy x3.
Слайд 26

Příklad

Příklad