Základy statistiky

Содержание

Слайд 2

VÝSTUPY Z UČENÍ Student bude: schopen rozlišovat nezávislé a závislé výběry

VÝSTUPY Z UČENÍ

Student bude:
schopen rozlišovat nezávislé a závislé výběry
umět vybrat vhodný

t-test
umět porovnat hodnoty populačních průměrů dvou nezávislých i závislých výběrů
Слайд 3

DVOUVÝBĚROVÉ TESTY KVANTITATIVNÍ DATA

DVOUVÝBĚROVÉ TESTY

KVANTITATIVNÍ DATA

Слайд 4

DVOUVÝBĚROVÝ t-TEST Porovnání populačních průměrů dvou nezávislých výběrů Oboustranný test H0:

DVOUVÝBĚROVÝ t-TEST

Porovnání populačních průměrů dvou nezávislých výběrů
Oboustranný test
H0: μ1 = μ2

vs. H1: μ1 ≠ μ2
Jednostranné testy
H0: μ1 = μ2 vs. H1: μ1 < μ2
H0: μ1 = μ2 vs. H1: μ1 > μ2
Слайд 5

DVOUVÝBĚROVÝ t-TEST PŘEDPOKLADY Nezávislé výběry (dvě různé skupiny) Normální rozdělení obou

DVOUVÝBĚROVÝ t-TEST PŘEDPOKLADY

Nezávislé výběry (dvě různé skupiny)
Normální rozdělení obou výběrů
lze obejít

přes velký počet dat v obou výběrech
Stejná variabilita dat (shoda rozptylů, homoskedasticita) v obou výběrech
Pokud heteroskedasticita ? Welchova modifikace t-testu
Слайд 6

PŘÍKLAD Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba

PŘÍKLAD

Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba combi

auta?
H0: μ1 = μ2 vs. H1: μ1 ≠ μ2
Je průměrná dálniční spotřeba pickupu vyšší než průměrná dálniční spotřeba combi auta?
H0: μ1 = μ2 vs. H1: μ1 > μ2
Je průměrná dálniční spotřeba pickupu o více jak 2 l/100 km vyšší než průměrná dálniční spotřeba combi auta?
H0: μ1 = μ2 + 2 vs. H1: μ1 > μ2 + 2
Слайд 7

PŘÍKLAD – GRAFY

PŘÍKLAD – GRAFY

Слайд 8

PŘÍKLAD I Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční

PŘÍKLAD I

Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba

combi auta?
H0: μ1 = μ2 vs. H1: μ1 ≠ μ2
Výběrové průměry (směrodatné odchylky)
pickup: 11,426 (1,828) vs. combi: 8,662 (1,426)
Studentův t-test : T = 6,128 p < 0,001
95% interval spolehlivosti: (1,858; 3,670)
Welchův t-test : T = 5,955 p < 0,001
95% interval spolehlivosti: (1,827; 3,702)
Na 5% hladině významnosti prokazujeme, že průměrná dálniční spotřeba pickupu je jiná než průměrná dálniční spotřeba combi auta.
Слайд 9

PŘÍKLAD II Je průměrná dálniční spotřeba pickupu vyšší než průměrná dálniční

PŘÍKLAD II

Je průměrná dálniční spotřeba pickupu vyšší než průměrná dálniční spotřeba

combi auta?
H0: μ1 = μ2 vs. H1: μ1 > μ2
Výběrové průměry (směrodatné odchylky)
pickup: 11,426 (1,828) vs. combi: 8,662 (1,426)
Studentův t-test : T = 6,128 p < 0,001
95% interval spolehlivosti: (2,008; +∞)
Welchův t-test : T = 5,955 p < 0,001
95% interval spolehlivosti: (1,983; +∞)
Na 5% hladině významnosti prokazujeme, že průměrná dálniční spotřeba pickupu je vyšší než průměrná dálniční spotřeba combi auta.
Слайд 10

PŘÍKLAD III Je průměrná dálniční spotřeba pickupu o více jak 2

PŘÍKLAD III

Je průměrná dálniční spotřeba pickupu o více jak 2 l/100

km vyšší než průměrná dálniční spotřeba combi auta?
H0: μ1 = μ2 + 2 vs. H1: μ1 > μ2 + 2
Výběrové průměry (směrodatné odchylky)
pickup: 11,426 (1,828) vs. combi: 8,662 (1,426)
Studentův t-test: T = 1,694 p = 0,048
95% interval spolehlivosti: (2,008; +∞)
Welchův t-test: T = 1,646 p = 0,054
95% interval spolehlivosti: (1,983; +∞)
Studentův t-test má signifikantní výsledek na rozdíl od Welchova t-testu.
Слайд 11

DVOUVÝBĚROVÝ F-TEST (ORIENTAČNĚ) Je směrodatná odchylka dálniční spotřeby pickupu stejná jako

DVOUVÝBĚROVÝ F-TEST (ORIENTAČNĚ)

Je směrodatná odchylka dálniční spotřeby pickupu stejná jako směrodatná odchylka

dálniční spotřeby combi auta?
H0: σ1 = σ2 vs. H1: σ1 ≠ σ2
H0: σ12 = σ22 vs. H1: σ12 ≠ σ22
H0: homoskedasticita vs. H1: heteroskedasticita
Výběrové směrodatné odchylky (rozptyly):
pickup: 1,828 (3,423) vs. combi: 1,426 (2,033)
Výsledek F-testu: F = 1,644 p = 0,214
Interval spolehlivosti: (0,747; 3,764)
Na 5% hladině významnosti nezamítáme homoskedasticitu (shodu populačních rozptylů).
Слайд 12

DVOUVÝBĚROVÝ t-TEST HOMOSKEDASTICITA Je-li shodná variabilita, potom homoskedastický test má o

DVOUVÝBĚROVÝ t-TEST HOMOSKEDASTICITA

Je-li shodná variabilita, potom homoskedastický test má o něco vyšší

sílu než test heteroskedastický.
Postup, kdy nejprve F-testem zjistíme, jestli lze nebo nelze předpokládat shodné rozptyly a poté se rozhodneme, zda použít heteroskedastickou nebo homoskedastickou verzi t-testu, zvyšuje pravděpodobnost chyby I. druhu nad povolené α.
Rozhodnutí o použitém testu by mělo být učiněno ještě předtím, než máme data (např. historická zkušenost)
Není-li k tomu nějaký zvláštní důvod, provádíme v praxi obvykle heteroskedastický t-test.
Слайд 13

DVOUVÝBĚROVÝ WILCOXONŮV TEST (INFORMATIVNĚ) Porovnání populačních mediánů dvou nezávislých výběrů Neparametrická

DVOUVÝBĚROVÝ WILCOXONŮV TEST (INFORMATIVNĚ)

Porovnání populačních mediánů dvou nezávislých výběrů
Neparametrická verze dvouvýběrového

t-testu
místo pozorování se používají jejich pořadí
Předpoklady
Nezávislé výběry (dvě různé skupiny)
Spojité rozdělení obou výběrů (kvantitativní data v jednotlivých výběrech by měly mít jen málo shod)
Stejná variabilita dat v obou výběrech
pokud není, pak je vhodnější Kolmogorovův-Smirnovův test
Слайд 14

PÁROVÉ TESTY KVANTITATIVNÍ DATA

PÁROVÉ TESTY

KVANTITATIVNÍ DATA

Слайд 15

PÁROVÝ T-TEST Porovnání populačních průměrů dvou závislých výběrů Předpoklady Závislé výběry

PÁROVÝ T-TEST

Porovnání populačních průměrů dvou závislých výběrů
Předpoklady
Závislé výběry (dvě měření u

stejné skupiny)
Normální rozdělení rozdílu výběrů (lze obejít přes velký počet dat)
jedná se vlastně o jednovýběrový t-test aplikovaný na rozdílová data
Слайд 16

PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního? Dvouvýběrový

PŘÍKLAD

Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
Dvouvýběrový přístup
Potřebujeme studii

uskutečnit hned teď
Do studie zahrneme skupinu
n1 žen x dní před menstruací
n2 žen x dní po menstruaci
Charakteristiky jednotlivých žen jsou rušivými faktory při analýze vlivu menstruace (faktor) na energetický příjem (odezva)
Zvyšuje se výběrová variabilita
Слайд 17

PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního? Párový

PŘÍKLAD

Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
Párový přístup
Studii lze

uskutečnit v období cca 1 měsíce
Do studie zahrneme skupinu n žen
Charakteristiky jednotlivých žen již nenaruší analýzu vlivu menstruace (faktor) na energetický příjem (odezva)
Nižší výběrová variabilita než u dvouvýběrového přístupu
Слайд 18

PŘÍKLAD Problém: Liší se předmenstruační energetický příjem od pomenstruačního? Denní energetický

PŘÍKLAD

Problém:
Liší se předmenstruační energetický příjem od pomenstruačního?
Denní energetický příjem v

kJ (datový soubor anorekticky.xlsx)
Zdroj dat: Altman, D.G. (1991). Practical Statistics for Medical Research. Chapman & Hall.
Слайд 19

PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLAD

Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

Слайд 20

PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLAD

Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

Слайд 21

PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLAD

Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

Слайд 22

PŘÍKLAD Problém: Lze použít jednovýběrový t-test s rozdíly?

PŘÍKLAD

Problém: Lze použít jednovýběrový t-test s rozdíly?

Слайд 23

PŘÍKLAD Liší se se předmenstruační energetický příjem od pomenstruačního? H0: μ1

PŘÍKLAD

Liší se se předmenstruační energetický příjem od pomenstruačního?
H0: μ1 = μ2

? H0: μ1 - μ2 = 0
H1: μ1 ≠ μ2 ? H1: μ1 - μ2 ≠ 0
Výsledek testu:
Testová statistika: 11,94
Dosažená hladina testu: p < 0,001
Na 5% hladině významnosti prokazujeme rozdíl mezi průměrným předmenstruačním a pomenstruačním energetickým příjmem.
Interval spolehlivosti pro μ1 - μ2:
(1074,1; 1566,8)
S 95% spolehlivostí je předmenstruační energetický příjem v průměru o nejméně 1 074,1 kJ a nejvýše o 1 566,8 kJ vyšší.
Слайд 24

VÝZNAM PÁROVÁNÍ Eliminuje předem známé zdroje variability (např. zdroj variability =

VÝZNAM PÁROVÁNÍ

Eliminuje předem známé zdroje variability
(např. zdroj variability = anorektička)
Rozdíly

se zjišťují nejprve uvnitř homogenní skupiny (anorektička) a teprve potom se průměrují (jednovýběrový t-test)
Dvouvýběrový přístup ≡ nejprve průměruje zvlášť ve dvou odlišných – heterogenních skupinách a teprve potom zjišťuje rozdíly
Слайд 25

DVOUVÝBĚROVÝ VS. PÁROVÝ TEST nutné vždy vybrat správnou variantu testu! (vyplývá

DVOUVÝBĚROVÝ VS. PÁROVÝ TEST

nutné vždy vybrat správnou variantu testu!
(vyplývá většinou

z povahy problému)
Příklady (který test vybrat?)
porovnání porodní hmotnosti narozených chlapců a děvčat
porovnání porodní hmotnosti narozených dvojčat
porovnání bazarových cen vozů ve dvou autobazarech
porovnání cen u stejných 100 výrobků v prodejně A a B
porovnání cen výrobků před slevou, a pak v době slevy
Слайд 26

PÁROVÝ WILCOXONŮV TEST Neparametrická verze párového t-testu jedná se vlastně o

PÁROVÝ WILCOXONŮV TEST

Neparametrická verze párového t-testu
jedná se vlastně o jednovýběrový Wilcoxonův

test aplikovaný na rozdíly
Předpoklady
Závislé výběry (dvě měření pro jednu skupinu, resp. dvě párová měření)
Spojité rozdělení rozdílu výběrů (rozdílová data by měla mít jen málo shod)
Symetrie rozdělení rozdílu (mírná asymetrie nevadí, pokud velká asymetrie, pak je vhodnější znaménkový test)
Слайд 27

POSTUP V EXCELU Dvouvýběrový Studentův t-test Data ? Analýza dat ?

POSTUP V EXCELU

Dvouvýběrový Studentův t-test
Data ? Analýza dat ? Dvouvýběrový t-test

s rovností rozptylů
Dvouvýběrový Welchův t-test
Data ? Analýza dat ? Dvouvýběrový t-test s nerovností rozptylů
Párový Studentův t-test
Data ? Analýza dat ? Dvouvýběrový párový t-test na střední hodnotu
Слайд 28

TESTOVÁ OTÁZKA 1 Předpoklady dvouvýběrového Welchova t-testu jsou: Vyberte libovolný počet

TESTOVÁ OTÁZKA 1

Předpoklady dvouvýběrového Welchova t-testu jsou:
Vyberte libovolný počet možných odpovědí. (Správná

nemusí být žádná, ale také mohou být správné všechny.)
homoskedasticita;
závislé výběry;
nezávislé výběry;
normální rozdělení.
Слайд 29

TESTOVÁ OTÁZKA 2 Jestliže chceme testovat shodu úrovně kvantitativního znaku ve

TESTOVÁ OTÁZKA 2

Jestliže chceme testovat shodu úrovně kvantitativního znaku ve dvou

odlišných skupinách a kvantitativní proměnná nesplňuje předpoklady pro použití dvouvýběrového (Studentova či Welchova) t-testu, možným použitelným testem v tomto případě je:
Vyberte jen jednu z následujících možných odpovědí.
dvouvýběrový F-test o shodě rozptylů;
dvouvýběrový test o proporcích;
dvouvýběrový Wilcoxonův pořadový test;
párový Studentův test. 
Слайд 30

KLÍČOVÁ SLOVA Nezávislé výběry Dvouvýběrový Studentův t-test Homoskedasticita Heteroskedasticita Dvouvýběrový Welchův

KLÍČOVÁ SLOVA

Nezávislé výběry
Dvouvýběrový Studentův t-test
Homoskedasticita
Heteroskedasticita
Dvouvýběrový Welchův t-test

Závislé výběry
Párování
Párový t-test
Dvouvýběrový Wilcoxonův test
Párový

Wilcoxonův test