Základy statistiky

Август 6, 2022

Содержание

2. VÝSTUPY Z UČENÍ Student bude: schopen rozlišovat nezávislé a závislé výběry umět vybrat vhodný t-test umět
3. DVOUVÝBĚROVÉ TESTY KVANTITATIVNÍ DATA
4. DVOUVÝBĚROVÝ t-TEST Porovnání populačních průměrů dvou nezávislých výběrů Oboustranný test H0: μ1 = μ2 vs. H1:
5. DVOUVÝBĚROVÝ t-TEST PŘEDPOKLADY Nezávislé výběry (dvě různé skupiny) Normální rozdělení obou výběrů lze obejít přes velký
6. PŘÍKLAD Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba combi auta? H0: μ1 =
7. PŘÍKLAD – GRAFY
8. PŘÍKLAD I Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba combi auta? H0: μ1
9. PŘÍKLAD II Je průměrná dálniční spotřeba pickupu vyšší než průměrná dálniční spotřeba combi auta? H0: μ1
10. PŘÍKLAD III Je průměrná dálniční spotřeba pickupu o více jak 2 l/100 km vyšší než průměrná
11. DVOUVÝBĚROVÝ F-TEST (ORIENTAČNĚ) Je směrodatná odchylka dálniční spotřeby pickupu stejná jako směrodatná odchylka dálniční spotřeby combi
12. DVOUVÝBĚROVÝ t-TEST HOMOSKEDASTICITA Je-li shodná variabilita, potom homoskedastický test má o něco vyšší sílu než test
13. DVOUVÝBĚROVÝ WILCOXONŮV TEST (INFORMATIVNĚ) Porovnání populačních mediánů dvou nezávislých výběrů Neparametrická verze dvouvýběrového t-testu místo pozorování
14. PÁROVÉ TESTY KVANTITATIVNÍ DATA
15. PÁROVÝ T-TEST Porovnání populačních průměrů dvou závislých výběrů Předpoklady Závislé výběry (dvě měření u stejné skupiny)
16. PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního? Dvouvýběrový přístup Potřebujeme studii uskutečnit hned
17. PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního? Párový přístup Studii lze uskutečnit v
18. PŘÍKLAD Problém: Liší se předmenstruační energetický příjem od pomenstruačního? Denní energetický příjem v kJ (datový soubor
19. PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
20. PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
21. PŘÍKLAD Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
22. PŘÍKLAD Problém: Lze použít jednovýběrový t-test s rozdíly?
23. PŘÍKLAD Liší se se předmenstruační energetický příjem od pomenstruačního? H0: μ1 = μ2 ? H0: μ1
24. VÝZNAM PÁROVÁNÍ Eliminuje předem známé zdroje variability (např. zdroj variability = anorektička) Rozdíly se zjišťují nejprve
25. DVOUVÝBĚROVÝ VS. PÁROVÝ TEST nutné vždy vybrat správnou variantu testu! (vyplývá většinou z povahy problému) Příklady
26. PÁROVÝ WILCOXONŮV TEST Neparametrická verze párového t-testu jedná se vlastně o jednovýběrový Wilcoxonův test aplikovaný na
27. POSTUP V EXCELU Dvouvýběrový Studentův t-test Data ? Analýza dat ? Dvouvýběrový t-test s rovností rozptylů
28. TESTOVÁ OTÁZKA 1 Předpoklady dvouvýběrového Welchova t-testu jsou: Vyberte libovolný počet možných odpovědí. (Správná nemusí být
29. TESTOVÁ OTÁZKA 2 Jestliže chceme testovat shodu úrovně kvantitativního znaku ve dvou odlišných skupinách a kvantitativní
30. KLÍČOVÁ SLOVA Nezávislé výběry Dvouvýběrový Studentův t-test Homoskedasticita Heteroskedasticita Dvouvýběrový Welchův t-test Závislé výběry Párování Párový
32. Скачать презентацию

Слайд 2

VÝSTUPY Z UČENÍ
Student bude:
schopen rozlišovat nezávislé a závislé výběry
umět vybrat vhodný

t-test
umět porovnat hodnoty populačních průměrů dvou nezávislých i závislých výběrů

Слайд 3

DVOUVÝBĚROVÉ TESTY
KVANTITATIVNÍ DATA

Слайд 4

DVOUVÝBĚROVÝ t-TEST
Porovnání populačních průměrů dvou nezávislých výběrů
Oboustranný test
H0: μ1 = μ2

vs. H1: μ1 ≠ μ2
Jednostranné testy
H0: μ1 = μ2 vs. H1: μ1 < μ2
H0: μ1 = μ2 vs. H1: μ1 > μ2

Слайд 5

DVOUVÝBĚROVÝ t-TEST PŘEDPOKLADY
Nezávislé výběry (dvě různé skupiny)
Normální rozdělení obou výběrů
lze obejít

přes velký počet dat v obou výběrech
Stejná variabilita dat (shoda rozptylů, homoskedasticita) v obou výběrech
Pokud heteroskedasticita ? Welchova modifikace t-testu

Слайд 6

PŘÍKLAD
Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba combi

auta?
H0: μ1 = μ2 vs. H1: μ1 ≠ μ2
Je průměrná dálniční spotřeba pickupu vyšší než průměrná dálniční spotřeba combi auta?
H0: μ1 = μ2 vs. H1: μ1 > μ2
Je průměrná dálniční spotřeba pickupu o více jak 2 l/100 km vyšší než průměrná dálniční spotřeba combi auta?
H0: μ1 = μ2 + 2 vs. H1: μ1 > μ2 + 2

Слайд 7

PŘÍKLAD – GRAFY

Слайд 8

PŘÍKLAD I
Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba

combi auta?
H0: μ1 = μ2 vs. H1: μ1 ≠ μ2
Výběrové průměry (směrodatné odchylky)
pickup: 11,426 (1,828) vs. combi: 8,662 (1,426)
Studentův t-test : T = 6,128 p < 0,001
95% interval spolehlivosti: (1,858; 3,670)
Welchův t-test : T = 5,955 p < 0,001
95% interval spolehlivosti: (1,827; 3,702)
Na 5% hladině významnosti prokazujeme, že průměrná dálniční spotřeba pickupu je jiná než průměrná dálniční spotřeba combi auta.

Слайд 9

PŘÍKLAD II
Je průměrná dálniční spotřeba pickupu vyšší než průměrná dálniční spotřeba

combi auta?
H0: μ1 = μ2 vs. H1: μ1 > μ2
Výběrové průměry (směrodatné odchylky)
pickup: 11,426 (1,828) vs. combi: 8,662 (1,426)
Studentův t-test : T = 6,128 p < 0,001
95% interval spolehlivosti: (2,008; +∞)
Welchův t-test : T = 5,955 p < 0,001
95% interval spolehlivosti: (1,983; +∞)
Na 5% hladině významnosti prokazujeme, že průměrná dálniční spotřeba pickupu je vyšší než průměrná dálniční spotřeba combi auta.

Слайд 10

PŘÍKLAD III
Je průměrná dálniční spotřeba pickupu o více jak 2 l/100

km vyšší než průměrná dálniční spotřeba combi auta?
H0: μ1 = μ2 + 2 vs. H1: μ1 > μ2 + 2
Výběrové průměry (směrodatné odchylky)
pickup: 11,426 (1,828) vs. combi: 8,662 (1,426)
Studentův t-test: T = 1,694 p = 0,048
95% interval spolehlivosti: (2,008; +∞)
Welchův t-test: T = 1,646 p = 0,054
95% interval spolehlivosti: (1,983; +∞)
Studentův t-test má signifikantní výsledek na rozdíl od Welchova t-testu.

Слайд 11

DVOUVÝBĚROVÝ F-TEST (ORIENTAČNĚ)
Je směrodatná odchylka dálniční spotřeby pickupu stejná jako směrodatná odchylka

dálniční spotřeby combi auta?
H0: σ1 = σ2 vs. H1: σ1 ≠ σ2
H0: σ12 = σ22 vs. H1: σ12 ≠ σ22
H0: homoskedasticita vs. H1: heteroskedasticita
Výběrové směrodatné odchylky (rozptyly):
pickup: 1,828 (3,423) vs. combi: 1,426 (2,033)
Výsledek F-testu: F = 1,644 p = 0,214
Interval spolehlivosti: (0,747; 3,764)
Na 5% hladině významnosti nezamítáme homoskedasticitu (shodu populačních rozptylů).

Слайд 12

DVOUVÝBĚROVÝ t-TEST HOMOSKEDASTICITA
Je-li shodná variabilita, potom homoskedastický test má o něco vyšší

sílu než test heteroskedastický.
Postup, kdy nejprve F-testem zjistíme, jestli lze nebo nelze předpokládat shodné rozptyly a poté se rozhodneme, zda použít heteroskedastickou nebo homoskedastickou verzi t-testu, zvyšuje pravděpodobnost chyby I. druhu nad povolené α.
Rozhodnutí o použitém testu by mělo být učiněno ještě předtím, než máme data (např. historická zkušenost)
Není-li k tomu nějaký zvláštní důvod, provádíme v praxi obvykle heteroskedastický t-test.

Слайд 13

DVOUVÝBĚROVÝ WILCOXONŮV TEST (INFORMATIVNĚ)
Porovnání populačních mediánů dvou nezávislých výběrů
Neparametrická verze dvouvýběrového

t-testu
místo pozorování se používají jejich pořadí
Předpoklady
Nezávislé výběry (dvě různé skupiny)
Spojité rozdělení obou výběrů (kvantitativní data v jednotlivých výběrech by měly mít jen málo shod)
Stejná variabilita dat v obou výběrech
pokud není, pak je vhodnější Kolmogorovův-Smirnovův test

Слайд 14

PÁROVÉ TESTY
KVANTITATIVNÍ DATA

Слайд 15

PÁROVÝ T-TEST
Porovnání populačních průměrů dvou závislých výběrů
Předpoklady
Závislé výběry (dvě měření u

stejné skupiny)
Normální rozdělení rozdílu výběrů (lze obejít přes velký počet dat)
jedná se vlastně o jednovýběrový t-test aplikovaný na rozdílová data

Слайд 16

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
Dvouvýběrový přístup
Potřebujeme studii

uskutečnit hned teď
Do studie zahrneme skupinu
n1 žen x dní před menstruací
n2 žen x dní po menstruaci
Charakteristiky jednotlivých žen jsou rušivými faktory při analýze vlivu menstruace (faktor) na energetický příjem (odezva)
Zvyšuje se výběrová variabilita

Слайд 17

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
Párový přístup
Studii lze

uskutečnit v období cca 1 měsíce
Do studie zahrneme skupinu n žen
Charakteristiky jednotlivých žen již nenaruší analýzu vlivu menstruace (faktor) na energetický příjem (odezva)
Nižší výběrová variabilita než u dvouvýběrového přístupu

Слайд 18

PŘÍKLAD
Problém:
Liší se předmenstruační energetický příjem od pomenstruačního?
Denní energetický příjem v

kJ (datový soubor anorekticky.xlsx)
Zdroj dat: Altman, D.G. (1991). Practical Statistics for Medical Research. Chapman & Hall.

Слайд 19

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

Слайд 20

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

Слайд 21

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

Слайд 22

PŘÍKLAD
Problém: Lze použít jednovýběrový t-test s rozdíly?

Слайд 23

PŘÍKLAD
Liší se se předmenstruační energetický příjem od pomenstruačního?
H0: μ1 = μ2

? H0: μ1 - μ2 = 0
H1: μ1 ≠ μ2 ? H1: μ1 - μ2 ≠ 0
Výsledek testu:
Testová statistika: 11,94
Dosažená hladina testu: p < 0,001
Na 5% hladině významnosti prokazujeme rozdíl mezi průměrným předmenstruačním a pomenstruačním energetickým příjmem.
Interval spolehlivosti pro μ1 - μ2:
(1074,1; 1566,8)
S 95% spolehlivostí je předmenstruační energetický příjem v průměru o nejméně 1 074,1 kJ a nejvýše o 1 566,8 kJ vyšší.

Слайд 24

VÝZNAM PÁROVÁNÍ
Eliminuje předem známé zdroje variability
(např. zdroj variability = anorektička)
Rozdíly

se zjišťují nejprve uvnitř homogenní skupiny (anorektička) a teprve potom se průměrují (jednovýběrový t-test)
Dvouvýběrový přístup ≡ nejprve průměruje zvlášť ve dvou odlišných – heterogenních skupinách a teprve potom zjišťuje rozdíly

Слайд 25

DVOUVÝBĚROVÝ VS. PÁROVÝ TEST
nutné vždy vybrat správnou variantu testu!
(vyplývá většinou

z povahy problému)
Příklady (který test vybrat?)
porovnání porodní hmotnosti narozených chlapců a děvčat
porovnání porodní hmotnosti narozených dvojčat
porovnání bazarových cen vozů ve dvou autobazarech
porovnání cen u stejných 100 výrobků v prodejně A a B
porovnání cen výrobků před slevou, a pak v době slevy

Слайд 26

PÁROVÝ WILCOXONŮV TEST
Neparametrická verze párového t-testu
jedná se vlastně o jednovýběrový Wilcoxonův

test aplikovaný na rozdíly
Předpoklady
Závislé výběry (dvě měření pro jednu skupinu, resp. dvě párová měření)
Spojité rozdělení rozdílu výběrů (rozdílová data by měla mít jen málo shod)
Symetrie rozdělení rozdílu (mírná asymetrie nevadí, pokud velká asymetrie, pak je vhodnější znaménkový test)

Слайд 27

POSTUP V EXCELU
Dvouvýběrový Studentův t-test
Data ? Analýza dat ? Dvouvýběrový t-test

s rovností rozptylů
Dvouvýběrový Welchův t-test
Data ? Analýza dat ? Dvouvýběrový t-test s nerovností rozptylů
Párový Studentův t-test
Data ? Analýza dat ? Dvouvýběrový párový t-test na střední hodnotu

Слайд 28

TESTOVÁ OTÁZKA 1
Předpoklady dvouvýběrového Welchova t-testu jsou:
Vyberte libovolný počet možných odpovědí. (Správná

nemusí být žádná, ale také mohou být správné všechny.)
homoskedasticita;
závislé výběry;
nezávislé výběry;
normální rozdělení.

Слайд 29

TESTOVÁ OTÁZKA 2
Jestliže chceme testovat shodu úrovně kvantitativního znaku ve dvou

odlišných skupinách a kvantitativní proměnná nesplňuje předpoklady pro použití dvouvýběrového (Studentova či Welchova) t-testu, možným použitelným testem v tomto případě je:
Vyberte jen jednu z následujících možných odpovědí.
dvouvýběrový F-test o shodě rozptylů;
dvouvýběrový test o proporcích;
dvouvýběrový Wilcoxonův pořadový test;
párový Studentův test.

Слайд 30

KLÍČOVÁ SLOVA
Nezávislé výběry
Dvouvýběrový Studentův t-test
Homoskedasticita
Heteroskedasticita
Dvouvýběrový Welchův t-test
Závislé výběry
Párování
Párový t-test
Dvouvýběrový Wilcoxonův test
Párový

Wilcoxonův test

Základy statistiky

Содержание

VÝSTUPY Z UČENÍStudent bude:schopen rozlišovat nezávislé a závislé výběryumět vybrat vhodný

DVOUVÝBĚROVÉ TESTYKVANTITATIVNÍ DATA

DVOUVÝBĚROVÝ t-TESTPorovnání populačních průměrů dvou nezávislých výběrůOboustranný testH0: μ1 = μ2

DVOUVÝBĚROVÝ t-TEST PŘEDPOKLADYNezávislé výběry (dvě různé skupiny)Normální rozdělení obou výběrů lze obejít

PŘÍKLADJe průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba combi

PŘÍKLAD – GRAFY

PŘÍKLAD IJe průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba

PŘÍKLAD IIJe průměrná dálniční spotřeba pickupu vyšší než průměrná dálniční spotřeba

PŘÍKLAD IIIJe průměrná dálniční spotřeba pickupu o více jak 2 l/100

DVOUVÝBĚROVÝ F-TEST (ORIENTAČNĚ)Je směrodatná odchylka dálniční spotřeby pickupu stejná jako směrodatná odchylka

DVOUVÝBĚROVÝ t-TEST HOMOSKEDASTICITAJe-li shodná variabilita, potom homoskedastický test má o něco vyšší

DVOUVÝBĚROVÝ WILCOXONŮV TEST (INFORMATIVNĚ)Porovnání populačních mediánů dvou nezávislých výběrůNeparametrická verze dvouvýběrového

PÁROVÉ TESTYKVANTITATIVNÍ DATA

PÁROVÝ T-TESTPorovnání populačních průměrů dvou závislých výběrůPředpokladyZávislé výběry (dvě měření u

PŘÍKLADProblém: Liší se se předmenstruační energetický příjem od pomenstruačního?Dvouvýběrový přístupPotřebujeme studii

PŘÍKLADProblém: Liší se se předmenstruační energetický příjem od pomenstruačního?Párový přístupStudii lze

PŘÍKLADProblém: Liší se předmenstruační energetický příjem od pomenstruačního?Denní energetický příjem v

PŘÍKLADProblém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLADProblém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLADProblém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLADProblém: Lze použít jednovýběrový t-test s rozdíly?

PŘÍKLADLiší se se předmenstruační energetický příjem od pomenstruačního?H0: μ1 = μ2

VÝZNAM PÁROVÁNÍEliminuje předem známé zdroje variability (např. zdroj variability = anorektička)Rozdíly

DVOUVÝBĚROVÝ VS. PÁROVÝ TESTnutné vždy vybrat správnou variantu testu! (vyplývá většinou

PÁROVÝ WILCOXONŮV TESTNeparametrická verze párového t-testujedná se vlastně o jednovýběrový Wilcoxonův

POSTUP V EXCELUDvouvýběrový Studentův t-testData ? Analýza dat ? Dvouvýběrový t-test

TESTOVÁ OTÁZKA 1Předpoklady dvouvýběrového Welchova t-testu jsou:Vyberte libovolný počet možných odpovědí. (Správná

TESTOVÁ OTÁZKA 2Jestliže chceme testovat shodu úrovně kvantitativního znaku ve dvou

KLÍČOVÁ SLOVANezávislé výběryDvouvýběrový Studentův t-testHomoskedasticitaHeteroskedasticitaDvouvýběrový Welchův t-testZávislé výběryPárováníPárový t-testDvouvýběrový Wilcoxonův testPárový

Похожие презентации

VÝSTUPY Z UČENÍ
Student bude:
schopen rozlišovat nezávislé a závislé výběry
umět vybrat vhodný

DVOUVÝBĚROVÉ TESTY
KVANTITATIVNÍ DATA

DVOUVÝBĚROVÝ t-TEST
Porovnání populačních průměrů dvou nezávislých výběrů
Oboustranný test
H0: μ1 = μ2

DVOUVÝBĚROVÝ t-TEST PŘEDPOKLADY
Nezávislé výběry (dvě různé skupiny)
Normální rozdělení obou výběrů
lze obejít

PŘÍKLAD
Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba combi

PŘÍKLAD I
Je průměrná dálniční spotřeba pickupu jiná než průměrná dálniční spotřeba

PŘÍKLAD II
Je průměrná dálniční spotřeba pickupu vyšší než průměrná dálniční spotřeba

PŘÍKLAD III
Je průměrná dálniční spotřeba pickupu o více jak 2 l/100

DVOUVÝBĚROVÝ F-TEST (ORIENTAČNĚ)
Je směrodatná odchylka dálniční spotřeby pickupu stejná jako směrodatná odchylka

DVOUVÝBĚROVÝ t-TEST HOMOSKEDASTICITA
Je-li shodná variabilita, potom homoskedastický test má o něco vyšší

DVOUVÝBĚROVÝ WILCOXONŮV TEST (INFORMATIVNĚ)
Porovnání populačních mediánů dvou nezávislých výběrů
Neparametrická verze dvouvýběrového

PÁROVÉ TESTY
KVANTITATIVNÍ DATA

PÁROVÝ T-TEST
Porovnání populačních průměrů dvou závislých výběrů
Předpoklady
Závislé výběry (dvě měření u

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
Dvouvýběrový přístup
Potřebujeme studii

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?
Párový přístup
Studii lze

PŘÍKLAD
Problém:
Liší se předmenstruační energetický příjem od pomenstruačního?
Denní energetický příjem v

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLAD
Problém: Liší se se předmenstruační energetický příjem od pomenstruačního?

PŘÍKLAD
Problém: Lze použít jednovýběrový t-test s rozdíly?

PŘÍKLAD
Liší se se předmenstruační energetický příjem od pomenstruačního?
H0: μ1 = μ2

VÝZNAM PÁROVÁNÍ
Eliminuje předem známé zdroje variability
(např. zdroj variability = anorektička)
Rozdíly

DVOUVÝBĚROVÝ VS. PÁROVÝ TEST
nutné vždy vybrat správnou variantu testu!
(vyplývá většinou

PÁROVÝ WILCOXONŮV TEST
Neparametrická verze párového t-testu
jedná se vlastně o jednovýběrový Wilcoxonův

POSTUP V EXCELU
Dvouvýběrový Studentův t-test
Data ? Analýza dat ? Dvouvýběrový t-test

TESTOVÁ OTÁZKA 1
Předpoklady dvouvýběrového Welchova t-testu jsou:
Vyberte libovolný počet možných odpovědí. (Správná

TESTOVÁ OTÁZKA 2
Jestliže chceme testovat shodu úrovně kvantitativního znaku ve dvou

KLÍČOVÁ SLOVA
Nezávislé výběry
Dvouvýběrový Studentův t-test
Homoskedasticita
Heteroskedasticita
Dvouvýběrový Welchův t-test
Závislé výběry
Párování
Párový t-test
Dvouvýběrový Wilcoxonův test
Párový