Základy statistiky

Содержание

Слайд 2

VÝSTUPY Z UČENÍ Student bude: umět ověřovat shodu pozorovaných četností s

VÝSTUPY Z UČENÍ

Student bude:
umět ověřovat shodu pozorovaných četností s očekávanými (populačními)
schopen

analyzovat kontingenční tabulky
umět porovnávat populační proporce v případě dvou nezávislých i závislých výběrů
schopen rozhodnout o závislosti dvou kategoriálních proměnných
Слайд 3

TESTY PRO KVALITATIVNÍ DATA

TESTY PRO KVALITATIVNÍ DATA

Слайд 4

χ2 TEST DOBRÉ SHODY Pearsonův chí-kvadrát test dobré shody Test o

χ2 TEST DOBRÉ SHODY

Pearsonův chí-kvadrát test dobré shody
Test o hodnotách

teoretických relativních četností pro jednotlivé kategorie kvalitativní proměnné
Testový problém pro dichotomickou proměnnou (I = 2) :
H0: π1 = π0 a π2 = 1 – π0 vs. H1: π1 ≠ π0 nebo π2 ≠ 1 – π0,
π0 je hypotetická hodnota – předem dané číslo z intervalu (0, 1)
Testový problém pro kategoriální proměnnou (I > 2):
H0: π1 = π1,0 a π2 = π2,0 a π3 = π3,0 a … a πI = πI,0
H1: π1 ≠ π 1,0 nebo π2 ≠ π2,0 nebo π3 ≠ π3,0 nebo … nebo πI ≠ πI,0
Слайд 5

PRINCIP A PŘEDPOKLADY TESTU PRINCIP: Test je založen na porovnání pozorovaných

PRINCIP A PŘEDPOKLADY TESTU

PRINCIP: Test je založen na porovnání
pozorovaných (empirických)

četností ni a
očekávaných (teoretických, hypotetických) četností nπi
Testová statistika:
PŘEDPOKLAD: Dostatečný počet dat
všechny očekávané četnosti mají být větší než 5
nπ1 > 5 a nπ2 > 5 a nπ3 > 5 a … a nπI > 5
ve výše uvedené podmínce se vyskytují očekávané (teoretické) a nikoliv pozorované (empirické) četnosti
Слайд 6

PŘÍKLAD NA TEST DOBRÉ SHODY Podporují data (inffilms.xlsx) následující představu, že

PŘÍKLAD NA TEST DOBRÉ SHODY

Podporují data (inffilms.xlsx) následující představu, že mezi ženami

je:
15 % těch, které jsou přesvědčeny o velmi negativním vlivu filmů
35 % s názorem, že vliv je negativní
25 % bez konkrétního názoru
20%, jež si myslí, že vliv je pozitivní
5%, jež si myslí, že vliv je velmi pozitivní
Слайд 7

PŘÍKLAD NA TEST DOBRÉ SHODY H0: π1 = 0,15; π2 =

PŘÍKLAD NA TEST DOBRÉ SHODY

H0: π1 = 0,15; π2 = 0,35; π3

= 0,25; π4= 0,20; π5= 0,05
Testová statistika: X2 = 8,650
Dosažená hladina testu: p = 0,071
Слайд 8

χ2 TEST NEZÁVISLOSTI Pearsonův chí-kvadrát test nezávislosti Analýza vztahu dvou kvalitativních

χ2 TEST NEZÁVISLOSTI

Pearsonův chí-kvadrát test nezávislosti
Analýza vztahu dvou kvalitativních znaků
Testový problém:
H0:

nezávislost dvou kvalitativních znaků
H1: závislost dvou kvalitativních znaků
Posuzování závislosti v kontingenční tabulce
např. souvisí kouření se vzděláním?
Test homogenity podmíněných rozdělení
např. je podíl kupujících časopis stejný u základoškoláků, středoškoláků a vysokoškoláků?
Слайд 9

PRINCIP χ2 TESTU NEZÁVISLOSTI

PRINCIP χ2 TESTU NEZÁVISLOSTI

 

Слайд 10

PŘÍKLAD VLIV FILMŮ NA DĚTI V rámci „General Social Survey“ prováděné

PŘÍKLAD VLIV FILMŮ NA DĚTI

V rámci „General Social Survey“ prováděné pravidelně v

USA byla v roce 1990 položena 1322 respondentům otázka týkající se jejich názoru na vliv současných filmů na děti.Respondent si mohl vybrat jednu z pěti následujících odpovědí: velmi pozitivní, pozitivní, neutrální, negativní, velmi negativní. Kromě názoru respondenta je zaznamenáno i jeho pohlaví (muž, žena).
Liší se názor dle pohlaví?
Výsledky průzkumu lze nalézt v souboru inffilms.xlsx v proměnné nazor a pohlavi.
Zdroj dat: http://sda.berkeley.edu/archive.htm
Слайд 11

PODMÍNĚNÉ ŘÁDKOVÉ RELATIVNÍ ČETNOSTI Podmíněné rozdělení názoru vzhledem k pohlaví Názor vzhledem k pohlaví

PODMÍNĚNÉ ŘÁDKOVÉ RELATIVNÍ ČETNOSTI

Podmíněné rozdělení názoru vzhledem k pohlaví
Názor vzhledem k

pohlaví
Слайд 12

CHÍ-KVADRÁT TEST NEZÁVISLOSTI Pozorované vs. Očekávané četnosti Testová statistika X2 =

CHÍ-KVADRÁT TEST NEZÁVISLOSTI

Pozorované vs. Očekávané četnosti
Testová statistika X2 = 18,7713
Dosažená hladina

testu p = 0,0009
Слайд 13

PŘEDPOKLAD TESTU Dostatečný počet dat všechny očekávané četnosti mají být větší

PŘEDPOKLAD TESTU

Dostatečný počet dat
všechny očekávané četnosti mají být větší než

5
ve výše uvedené podmínce se vyskytují očekávané (teoretické) a nikoliv pozorované (empirické) četnosti
existují i méně přísná kritéria
V případě nesplněného předpokladu lze
sloučit některé kategorie
použít jiný (exaktní) test
(zobecněný) Fisherův faktoriálový test
Слайд 14

McNEMARŮV TEST Analýza párových dichotomických proměnných Porovnávání populačních proporcí u dvou

McNEMARŮV TEST

Analýza párových dichotomických proměnných
Porovnávání populačních proporcí u dvou závislých výběrů
Testový

problém (párové srovnávání): H0: π1 = π2 vs. H1: π1 ≠ π2
π1 – populační proporce pro první výběr
π2 – populační proporce pro první výběr
Chí-kvadrát test homogenity okrajových četností v čtyřpolní tabulce (2 x 2)
Слайд 15

McNEMARŮV TEST TESTOVÝ PROBLÉM Teoretické (relativní) četnosti – pravděpodobnosti π1+ –

McNEMARŮV TEST TESTOVÝ PROBLÉM

Teoretické (relativní) četnosti – pravděpodobnosti
π1+ – pravděpodobnost jevu PŘED

událostí
π+1 – pravděpodobnost jevu PO události
Testový problém (párové srovnávání): H0: π1+ = π+1 vs. H1: π1+ ≠ π+1
H0: Pravděpodobnost jevu je před i po události stejná
H1: Pravděpodobnost jevu je před i po události jiná
Слайд 16

McNEMARŮV TEST

McNEMARŮV TEST

 

Слайд 17

McNEMARŮV TEST PŘÍKLAD Skupina 1 600 respondentů odpovídala na otázku, zda

McNEMARŮV TEST PŘÍKLAD

Skupina 1 600 respondentů odpovídala na otázku, zda si pravidelně kupuje

určitý výrobek, či nikoliv. Po provedení reklamní kampaně byla stejným respondentům položena stejná otázka
Problém: Měla reklamní kampaň nějaký efekt?
Слайд 18

McNEMARŮV TEST PŘÍKLAD Problém: Měla reklamní kampaň nějaký efekt? Homogenita marginálních

McNEMARŮV TEST PŘÍKLAD

Problém: Měla reklamní kampaň nějaký efekt?
Homogenita marginálních rozdělení
Změnila či nezměnila

se relativní četnost kupujících si výrobek před a po kampani? (párové srovnávání)
Odhad této změny:
Před kampaní kupovalo 57,5 % a po kampani 56,5 % respondentů
Pokles o 1%, je tento pokles statisticky významný?
Слайд 19

McNEMARŮV TEST

McNEMARŮV TEST

 

Слайд 20

McNEMARŮV TEST VÝSLEDEK TESTU Testová statistika X2 = 1,0847 Dosažená hladina

McNEMARŮV TEST VÝSLEDEK TESTU

Testová statistika X2 = 1,0847
Dosažená hladina testu p =

0,2976
Na 5% hladině významnosti nejsou pozorované rozdíly statisticky významné.
Nelze prokázat, že by reklamní kampaň měla nějaký vliv (kladný či záporný) na chování spotřebitelů.
Pozorované rozdíly je nutno přičíst na vrub výběrové variabilitě.
Слайд 21

POSTUP V EXCELU Chí-kvadrát test dobré shody funkce CHISQ.TEST(aktuální, očekávané) Chí-kvadrát

POSTUP V EXCELU

Chí-kvadrát test dobré shody
funkce CHISQ.TEST(aktuální, očekávané)
Chí-kvadrát test nezávislosti


funkce CHISQ.TEST(aktuální, očekávané)
McNemarův test
funkce CHISQ.DIST.RT(statistika, 1)
Слайд 22

TESTOVÁ OTÁZKA 1 Základní myšlenkou chí-kvadrát testu dobré shody je, že

TESTOVÁ OTÁZKA 1

Základní myšlenkou chí-kvadrát testu dobré shody je, že pro alternativní

hypotézu svědčí větší rozdíly mezi pozorovanými a očekávanými četnostmi. Je to pravda?
Vyberte ano/ne na zadanou otázku.
Слайд 23

TESTOVÁ OTÁZKA 2 Závislost dvou alternativních znaků (např. koupě časopisu na

TESTOVÁ OTÁZKA 2

Závislost dvou alternativních znaků (např. koupě časopisu na pohlaví) lze

ověřit:
Vyberte libovolný počet možných odpovědí. (Správná nemusí být žádná, ale také mohou být správné všechny.)
McNemarovým testem;
Personovým chí-kvadrát testem dobré shody;
Personovým chí-kvadrát testem nezávislosti;
Fisherovým (faktoriálovým) testem.
Слайд 24

TESTOVÁ OTÁZKA 3 Předpokladem použití Pearsonova chí-kvadrát testu nezávislosti je Vyberte

TESTOVÁ OTÁZKA 3

Předpokladem použití Pearsonova chí-kvadrát testu nezávislosti je
Vyberte libovolný počet možných odpovědí.

(Správná nemusí být žádná, ale také mohou být správné všechny.)
normální rozdělení jednotlivých kategorií;
všechny očekávané četnosti vyšší než 5;
všechny empirické četnosti vyšší než 5;
Všechny hypotetické četnosti vyšší než 5.
Слайд 25

KLÍČOVÁ SLOVA Nulová hypotéza Alternativní hypotéza Statistický test Hladina významnosti P-hodnota

KLÍČOVÁ SLOVA

Nulová hypotéza
Alternativní hypotéza
Statistický test
Hladina významnosti
P-hodnota
Statistická významnost
Jednovýběrový t-test
Nezávislé výběry
Dvouvýběrový t-test
Homoskedasticita

Závislé výběry
Párový

t-test
Pozorované četnosti
Očekávané četnosti
Chí-kvadrát test dobré shody
Chí-kvadrát test nezávislosti
Homogenita podmíněných rozdělení
Homogenita marginálních rozdělení
McNemarův test