- Главная
- Математика
- Časové řady v systému SAS
Содержание
- 2. Základní pojmy Časová řada Posloupnost věcně a prostorově srovnatelných pozorování, která jsou jednoznačně uspořádána z hlediska
- 3. Srovnatelnost údajů v časové řadě Věcné hledisko - údaje by měly být stejně obsahově vymezené(typické pro
- 4. Cíl analýzy časových řad interpolace(vyrovnání časové řady) – pochopení minulého vývoje tj. nalezení matematické funkce, která
- 5. Grafická analýza časových řad grafy jedné a více časových řad, z nichž získáváme prvotní informace pro
- 6. Elementární charakteristiky časových řad ABSOLUTNÍ charakteristiky (absolutní porovnání hodnot) – první absolutní diference (absolutní přírůstky), druhé
- 7. Základní metody a postupy pro analýzu časových řad Průzkumová analýza časových řad - cílem průzkumové analýzy
- 8. Jednorozměrná analýza časových řad – dekompozice Při jednorozměrné analýze časových řad se vychází z empiricky odpozorované
- 9. Metody vyrovnávání časových řad Vyrovnání pomocí klouzavých průměrů spočívá v nahrazení skutečných hodnot ČŘ průměrem z
- 10. Trendové funkce Lineární Tt = a + b· t Kvadratická Tt = a + b· t
- 11. Adaptivní modely časových řad Modely analytického vyrovnávání (pomocí trendových funkcí) přiřazují všem hodnotám časové řady stejné
- 12. Brownovy modely expon. vyrovnávání Důležitou podtřídou adaptivních modelů jsou tzv. Brownovy modely exponenciálního vyrovnávání. S využitím
- 13. Často používaným ukazatelem, který slouží k popisu stupně shody je index resp. koeficient determinace, přičemž čím
- 14. Periodická složka: ≤ 1 rok … sezónní složka St > 1 rok … cyklická složka Ct
- 15. Analýza časových řad se v podstatě provádí ve dvou základních fázích, jimiž jsou fáze interpolace časové
- 16. Kombinované modely Zejména pokud by u vybraných nejlepších prognostických modelů bylo dosaženo výsledků, které se z
- 17. Hledání optimálního modelu (kandidáta) v systému SAS Navržení vhodných kandidátů pro účely modelování minulého vývoje sledovaných
- 19. Скачать презентацию
Základní pojmy
Časová řada
Posloupnost věcně a prostorově srovnatelných pozorování, která jsou jednoznačně
Základní pojmy
Časová řada
Posloupnost věcně a prostorově srovnatelných pozorování, která jsou jednoznačně
Rozlišujeme:
Dle periodicity ukazatele - Krátkodobé a dlouhodobé časové řady
Dle charakteru ukazatele - A intervalové a okamžikové časové řady
Intervalové časové řady
velikost ukazatele závisí na délce intervalu, za který je sledován,
pro ukazatele je možné tvořit součty a tento součet má reálný význam
mají se vztahovat ke stejně dlouhým intervalům, jinak jde o srovnání zkreslené
Okamžikové časové řady
jsou sestavovány z ukazatelů, které se vztahují k určitému okamžiku,
součet za několik po sobě jdoucích hodnot nedává reálný smysl, proto se neprovádí,
shrnování ukazatelů se provádí pomocí chronologického průměru.
Srovnatelnost údajů v časové řadě
Věcné hledisko
- údaje by měly být stejně
Srovnatelnost údajů v časové řadě
Věcné hledisko
- údaje by měly být stejně
Prostorové hledisko
- používat údaje vztahující se ke stejným geografickým územím
Časové hledisko
- tento problém se objevuje zejména u intervalových časových řad, kdy se údaje mají vztahovat ke stejně dlouhým intervalům
Cenové hledisko
- použití běžných nebo stálých cen (dává se jim přednost)
Cíl analýzy časových řad
interpolace(vyrovnání časové řady) – pochopení minulého vývoje tj.
Cíl analýzy časových řad
interpolace(vyrovnání časové řady) – pochopení minulého vývoje tj.
extrapolace(prodloužení časové řady) – především nás zajímá další vývoj – prognózování budoucího vývoje
Grafická analýza časových řad
grafy jedné a více časových řad, z nichž
Grafická analýza časových řad
grafy jedné a více časových řad, z nichž
grafy průzkumové analýzy časových řad, jež poskytují detailnější pohled na analyzované časové řady. Do této skupiny patří především boxplot a stem-and-leaf plot („lodyha s listy“).
grafy sloužící pro identifikaci, testování a modelování složek časových řad, jako je například histogram, Q-Q graf, korelogram (tzn. grafy autokorelační a parciální autokorelační funkce), periodogram, kumulovaný periodogram).
Elementární charakteristiky časových řad
ABSOLUTNÍ charakteristiky (absolutní porovnání hodnot) – první absolutní
Elementární charakteristiky časových řad
ABSOLUTNÍ charakteristiky (absolutní porovnání hodnot) – první absolutní
RELATIVNÍ charakteristiky (bezrozměrné veličiny)
– koeficient růstu – relativní postupná rychlost změn hodnot v čř
- tempo růstu – koeficient růstu vyjádřený v procentech
- průměrný koeficient růstu (pro monotónní vývoj časové řady, geometrický průměr jednotlivých koeficientů růstu)
Úroveň ukazatelů se charakterizuje nejčastěji pomocí průměrů
Intervalová řada – prostý nebo vážený aritmetický průměr
Okamžiková řada – prostý nebo vážený chronologický průměr
Pro popis vývoje/dynamiky sledovaného ukazatele se využívá též indexní analýza
Základní metody a postupy pro analýzu časových řad
Průzkumová analýza časových
Základní metody a postupy pro analýzu časových řad
Průzkumová analýza časových
- cílem průzkumové analýzy časových řad je postižení zvláštností a nedostatků ve zpracovávaných statistických datech a posouzení platnosti předpokladů nutných pro jejich následné statistické zpracování
Dekompozice časových řad
- kladou důraz především na práci se systematickými složkami časové řady (tj. s trendovou, sezónní a cyklickou složkou) a jednotlivá pozorování se obvykle berou jako navzájem nekorelovaná. Často používaným matematickým nástrojem v dekompozičních metodách je regresní analýza
Boxovu-Jenkinsovu metodologii
- Boxův - Jenkinsův přístup naproti tomu bere za základní prvek konstrukce modelu časové řady reziduální složku, která může být tvořena korelovanými (závislými) náhodnými veličinami. Boxova - Jenkinsova metodologie tedy může nejen zpracovávat časové řady s navzájem závislými pozorováními, ale dokonce těžiště jejich postupů spočívá právě ve vyšetřování těchto závislostí neboli v tzv. korelační analýze
Lineární dynamické modely
- Data, která se používají v ekonometrii, mají obvykle tvar časových řad. Odpovídající ekonometrické modely jsou však většinou konstruovány tak, že hodnoty určité časové řady jsou vysvětlovány pomocí hodnot dalších (tzv. vysvětlujících nebo faktorových) časových řad, které vysvětlovanou řadu ovlivňují (např. výdaje obyvatelstva na nákup spotřebního zboží v roce t jsou vysvětlovány pomocí své minulé hodnoty a navíc pomocí disponibilních peněžních příjmů obyvatelstva a cenového indexu spotřebního zboží).
A spektrální analýza časových řad
- Předchozí přístupy by bylo možné shrnout pod označení analýza časových řad v časové doméně. Odlišný přístup, který považuje zkoumanou časovou řadu za (nekonečnou) směs sinusových a kosinusových křivek s různými amplitudami a frekvencemi, nese označení analýza časových řad ve spektrální doméně nebo spektrální analýza časových řad (někdy též fourierovská analýza).
Jednorozměrná analýza časových řad – dekompozice
Při jednorozměrné analýze časových řad se
Jednorozměrná analýza časových řad – dekompozice
Při jednorozměrné analýze časových řad se
trend
sezónní složku
cyklickou složku a
náhodnou složku, přičemž současná existence všech těchto forem však není nutná
členíme poté řady na neperiodické a periodické
Dekompozice: aditivní nebo multiplikativní
Hlavním úkolem analýzy neperiodických ČŘ je vystižení základní tendence jejich vývoje – trendu.
Popis trendu v časových řadách je možný:
Graficky
Mechanicky (pomocí klouzavých průměrů)
Analyticky (pomocí trendových funkcí).
Metody vyrovnávání časových řad
Vyrovnání pomocí klouzavých průměrů spočívá v nahrazení skutečných
Metody vyrovnávání časových řad
Vyrovnání pomocí klouzavých průměrů spočívá v nahrazení skutečných
Metoda vyrovnávání časových řad, spočívající v tom, že trend popíšeme pomocí vhodné matematické funkce, se nazývá tzv. analytické vyrovnávání. Analytické vyrovnávání časových řad trendovými funkcemi je tradiční způsob popisu trendu časové řady. Aplikace analytických metod bývá většinou bez větších problémů a následná interpretace výsledků je jednoduchá. Nabídka trendových funkcí je rozmanitá. Mezi trendové funkce, jež nejlépe prezentují ekonomické časové řady řadíme následující:
Trendové funkce
Lineární Tt = a + b· t
Kvadratická Tt
Trendové funkce
Lineární Tt = a + b· t
Kvadratická Tt
Logaritmická Tt = a + b· log t
Exponenciální Tt = a · bt
Mocninná Tt = a · tb
Odmocninná
Adaptivní modely časových řad
Modely analytického vyrovnávání (pomocí trendových funkcí) přiřazují všem
Adaptivní modely časových řad
Modely analytického vyrovnávání (pomocí trendových funkcí) přiřazují všem
V případě mnoha reálných ekonomických časových řad velmi často nereálný, může vést k selhání analytických modelů (není možné k popisu použít jednu matematickou funkci s konstantními parametry).
Pak se úspěchem uplatňují modely adaptivní, které předpokládají, že pro konstrukci extrapolační prognózy budoucího vývoje jsou nejcennější nejnovější pozorování časové řady. Proto jsou těmto nejnovějším pozorováním časové řady přiřazeny největší váhy a starší pozorování se buď úplně vyřazují ze zkoumání, nebo se jim přiřazují menší váhy ve srovnání s později pozorovanými hodnotami. Adaptivní modely tedy berou v úvahu stárnutí informací. Systém vah je tvořen pomocí tzv. vyrovnávacích konstant, které nabývají hodnot z intervalu < 0, 1 > a pro nalezení optimální hodnoty vyrovnávací konstanty se v praxi využívá „metody pokusů a omylů“. Za optimální hodnotu je považována ta hodnota, která minimalizuje vhodně zvolenou chybu odhadu (nejčastěji MSE). Statistický systém SAS, který bude v této práci využit pro efektivní realizaci všech potřebných analýz, provádí odhad hodnoty vyrovnávací konstanty automaticky.
Brownovy modely expon. vyrovnávání
Důležitou podtřídou adaptivních modelů jsou tzv. Brownovy modely
Brownovy modely expon. vyrovnávání
Důležitou podtřídou adaptivních modelů jsou tzv. Brownovy modely
Zmíněné Brownovy modely přináší v praktických aplikacích dobré výsledky.
Mezi další významné představitele exponenciálního vyrovnávání patří Holtův model exponenciálního vyrovnávání, model exponenciálního vyrovnávání s tlumeným lineárním trendem a Wintersův model exponenciálního vyrovnávání sezónních časových řad.
Často používaným ukazatelem, který slouží k popisu stupně shody je index
Moderní statistická metodologie standardně implementovaná v statistických programech:
M.E. – střední chyba odhadu
M.S.E. – střední kvadratická chyba odhadu
M.A.E. střední absolutní chyba odhadu
M.P.E. – střední procentuální chyba odhadu
M.A.P.E. – střední absolutní procentuální chyba odhadu – nejvyužívanější
Obecně za velmi vhodně použitý model je hodnota MAPE 10%, ale můžeme se setkat i se situacemi, kdy je požadována hodnota 5% či naopak větší např. 15%. Hodnota MAPE (respektive její výše) se pohybuje v závislosti na dané situaci.
Posouzení vhodnosti modelů ČŘ
Periodická složka:
≤ 1 rok … sezónní složka St
> 1 rok …
≤ 1 rok … sezónní složka St
> 1 rok …
Periodická složka bývá velmi často reprezentována sezónní složkou, tato se vyskytuje pouze v krátkodobých časových řadách.
Velmi důležitá je v tomto případě identifikace a popis sezónní složky. Vždy je potřeba identifikovat, zda je sezonní kolísání skutečně statisticky významné
(grafická analýza, výpočet klouzavých průměrů, autokorelační funkce, analýza periodogramu).
Sezónními vlivy se rozumí soubor přímých či nepřímých příčin, které se opakují.
Důsledkem působení sezónních vlivů na analyzovanou časovou řadu jsou tzv. sezónní výkyvy, tj. pravidelné výkyvy zkoumané čas. Řady nahoru a dolů vůči určitému „nesezónnímu“ normálnímu vývoji řady v průběhu let.
Intenzitu sezónního kolísání měříme pomocí absolutních sezónních odchylek nebo sezónních indexů.
Před vlastní analýzou časové řady (trendu) je potřeba časovou řadu očistit od periodického kolísání, které by mohlo maskovat charakter trendu časové řady – pak mluvíme o sezónním očišťování:
- aditivní model – od hodnot původní časové řady odčítáme sezónní odchylky
- multiplikativní model - hodnoty původní časové řady dělíme sezónním indexem.
Analýza periodických ČŘ
Analýza časových řad se v podstatě provádí ve dvou základních fázích,
Dva základní typy předpovědí: bodová a intervalová.
Každá předpověď je spojena s určitou chybou předpovědi. Případná chyba je tím větší, čím kratší je délka časové řady, čím nedokonalejší je popis uplynulého vývoje a čím vzdálenější je horizont předpovědi.
Přesnost předpovědí je možné hodnotit ex post pomocí tzv. pseudoprognóz. Jedná se o prognózu v časti časového období, kdy již známe skutečnost. Porovnáním skutečných a prognózovaných hodnot získáme charakteristiky, které hodnotí přesnost prognózy.
Mezi tyto charakteristiky patří mimo jiné například :
Relativní chyba prognózy (podíl absolutní chyby prognózy a skutečné hodnoty)
A Theilův koeficient nesouladu (odmocnina tohoto koeficientu se uvádí v procentech jako chyba prognózy).
Předpovědi časových řad
Kombinované modely
Zejména pokud by u vybraných nejlepších prognostických modelů bylo dosaženo
Kombinované modely
Zejména pokud by u vybraných nejlepších prognostických modelů bylo dosaženo
Tyto konstruují předpovědi ve formě určitých kombinací předpovědí poskytnutých jednotlivými individuálními modely.
Systém SAS nabízí možnost kombinování individuálních předpovědí ve formě jejich prostého nebo váženého aritmetického průměru s různým systémem vah (nabízené tzv.regresními váhy jistým způsobem penalizují předpovědi zatížené vyššími předpovědními chybami zvoleného hodnotícího kritéria).
Hledání optimálního modelu (kandidáta) v systému SAS
Navržení vhodných kandidátů pro účely
Hledání optimálního modelu (kandidáta) v systému SAS
Navržení vhodných kandidátů pro účely
Hledání optimálního modelu může být někdy velmi zdlouhavé.
Pro zrychlení tohoto procesu je možné využít režimu automatického výběru modelů procedury Time Series Forecasting Systém (TSFS), který je součastí systému SAS (modul ETS).
Modul ETS nabízí možnost diagnostikovat časovou řadu z hlediska přítomnosti trendu, sezónnosti či nutnosti logaritmické transformace dat. Režim automatického výběru modelů se pak při vyhledávání nejvhodnějšího modelu o tyto diagnostické testy opírá.