Časové řady v systému SAS

Содержание

Слайд 2

Základní pojmy Časová řada Posloupnost věcně a prostorově srovnatelných pozorování, která

Základní pojmy

Časová řada
Posloupnost věcně a prostorově srovnatelných pozorování, která jsou jednoznačně

uspořádána z hlediska času ve směru minulost - přítomnost.
Rozlišujeme:
Dle periodicity ukazatele - Krátkodobé a dlouhodobé časové řady
Dle charakteru ukazatele - A intervalové a okamžikové časové řady
Intervalové časové řady
velikost ukazatele závisí na délce intervalu, za který je sledován,
pro ukazatele je možné tvořit součty a tento součet má reálný význam
mají se vztahovat ke stejně dlouhým intervalům, jinak jde o srovnání zkreslené
Okamžikové časové řady
jsou sestavovány z ukazatelů, které se vztahují k určitému okamžiku,
součet za několik po sobě jdoucích hodnot nedává reálný smysl, proto se neprovádí,
shrnování ukazatelů se provádí pomocí chronologického průměru.
Слайд 3

Srovnatelnost údajů v časové řadě Věcné hledisko - údaje by měly

Srovnatelnost údajů v časové řadě

Věcné hledisko
- údaje by měly být stejně

obsahově vymezené(typické pro naturální ukazatele)
Prostorové hledisko
- používat údaje vztahující se ke stejným geografickým územím
Časové hledisko
- tento problém se objevuje zejména u intervalových časových řad, kdy se údaje mají vztahovat ke stejně dlouhým intervalům
Cenové hledisko
- použití běžných nebo stálých cen (dává se jim přednost)
Слайд 4

Cíl analýzy časových řad interpolace(vyrovnání časové řady) – pochopení minulého vývoje

Cíl analýzy časových řad
interpolace(vyrovnání časové řady) – pochopení minulého vývoje tj.

nalezení matematické funkce, která dokáže časový vývoj popsat
extrapolace(prodloužení časové řady) – především nás zajímá další vývoj – prognózování budoucího vývoje
Слайд 5

Grafická analýza časových řad grafy jedné a více časových řad, z

Grafická analýza časových řad
grafy jedné a více časových řad, z nichž

získáváme prvotní informace pro analýzu časových řad. Do této skupiny řadíme mimo jiné grafy spojnicové (nejjednodušší), sloupkové grafy nebo tzv. výsečové či koláčové grafy.
grafy průzkumové analýzy časových řad, jež poskytují detailnější pohled na analyzované časové řady. Do této skupiny patří především boxplot a stem-and-leaf plot („lodyha s listy“).
grafy sloužící pro identifikaci, testování a modelování složek časových řad, jako je například histogram, Q-Q graf, korelogram (tzn. grafy autokorelační a parciální autokorelační funkce), periodogram, kumulovaný periodogram).
Слайд 6

Elementární charakteristiky časových řad ABSOLUTNÍ charakteristiky (absolutní porovnání hodnot) – první

Elementární charakteristiky časových řad
ABSOLUTNÍ charakteristiky (absolutní porovnání hodnot) – první absolutní

diference (absolutní přírůstky), druhé absolutní diference, průměrný absolutní přírůstek
RELATIVNÍ charakteristiky (bezrozměrné veličiny)
– koeficient růstu – relativní postupná rychlost změn hodnot v čř
- tempo růstu – koeficient růstu vyjádřený v procentech
- průměrný koeficient růstu (pro monotónní vývoj časové řady, geometrický průměr jednotlivých koeficientů růstu)
Úroveň ukazatelů se charakterizuje nejčastěji pomocí průměrů
Intervalová řada – prostý nebo vážený aritmetický průměr
Okamžiková řada – prostý nebo vážený chronologický průměr
Pro popis vývoje/dynamiky sledovaného ukazatele se využívá též indexní analýza
Слайд 7

Základní metody a postupy pro analýzu časových řad Průzkumová analýza časových

Základní metody a postupy pro analýzu časových řad
Průzkumová analýza časových

řad
- cílem průzkumové analýzy časových řad je postižení zvláštností a nedostatků ve zpracovávaných statistických datech a posouzení platnosti předpokladů nutných pro jejich následné statistické zpracování
Dekompozice časových řad
- kladou důraz především na práci se systematickými složkami časové řady (tj. s trendovou, sezónní a cyklickou složkou) a jednotlivá pozorování se obvykle berou jako navzájem nekorelovaná. Často používaným matematickým nástrojem v dekompozičních metodách je regresní analýza
Boxovu-Jenkinsovu metodologii
- Boxův - Jenkinsův přístup naproti tomu bere za základní prvek konstrukce modelu časové řady reziduální složku, která může být tvořena korelovanými (závislými) náhodnými veličinami. Boxova - Jenkinsova metodologie tedy může nejen zpracovávat časové řady s navzájem závislými pozorováními, ale dokonce těžiště jejich postupů spočívá právě ve vyšetřování těchto závislostí neboli v tzv. korelační analýze
Lineární dynamické modely
- Data, která se používají v ekonometrii, mají obvykle tvar časových řad. Odpovídající ekonometrické modely jsou však většinou konstruovány tak, že hodnoty určité časové řady jsou vysvětlovány pomocí hodnot dalších (tzv. vysvětlujících nebo faktorových) časových řad, které vysvětlovanou řadu ovlivňují (např. výdaje obyvatelstva na nákup spotřebního zboží v roce t jsou vysvětlovány pomocí své minulé hodnoty a navíc pomocí disponibilních peněžních příjmů obyvatelstva a cenového indexu spotřebního zboží).
A spektrální analýza časových řad
- Předchozí přístupy by bylo možné shrnout pod označení analýza časových řad v časové doméně. Odlišný přístup, který považuje zkoumanou časovou řadu za (nekonečnou) směs sinusových a kosinusových křivek s různými amplitudami a frekvencemi, nese označení analýza časových řad ve spektrální doméně nebo spektrální analýza časových řad (někdy též fourierovská analýza).
Слайд 8

Jednorozměrná analýza časových řad – dekompozice Při jednorozměrné analýze časových řad

Jednorozměrná analýza časových řad – dekompozice

Při jednorozměrné analýze časových řad se

vychází z empiricky odpozorované zkušenosti, že každá časová řada může obsahovat následující čtyři složky, které vyjadřují různé druhy pohybu:
trend
sezónní složku
cyklickou složku a
náhodnou složku, přičemž současná existence všech těchto forem však není nutná
členíme poté řady na neperiodické a periodické
Dekompozice: aditivní nebo multiplikativní
Hlavním úkolem analýzy neperiodických ČŘ je vystižení základní tendence jejich vývoje – trendu.
Popis trendu v časových řadách je možný:
Graficky
Mechanicky (pomocí klouzavých průměrů)
Analyticky (pomocí trendových funkcí).
Слайд 9

Metody vyrovnávání časových řad Vyrovnání pomocí klouzavých průměrů spočívá v nahrazení

Metody vyrovnávání časových řad
Vyrovnání pomocí klouzavých průměrů spočívá v nahrazení skutečných

hodnot ČŘ průměrem z určitého počtu hodnot. Trend v krátkých časových úsecích odhadujeme průměrem několika sousedních pozorování (3-leté, 5-leté, atd.).
Metoda vyrovnávání časových řad, spočívající v tom, že trend popíšeme pomocí vhodné matematické funkce, se nazývá tzv. analytické vyrovnávání. Analytické vyrovnávání časových řad trendovými funkcemi je tradiční způsob popisu trendu časové řady. Aplikace analytických metod bývá většinou bez větších problémů a následná interpretace výsledků je jednoduchá. Nabídka trendových funkcí je rozmanitá. Mezi trendové funkce, jež nejlépe prezentují ekonomické časové řady řadíme následující:
Слайд 10

Trendové funkce Lineární Tt = a + b· t Kvadratická Tt

Trendové funkce
Lineární Tt = a + b· t
Kvadratická Tt

= a + b· t + c· t2
Logaritmická Tt = a + b· log t
Exponenciální Tt = a · bt
Mocninná Tt = a · tb
Odmocninná
Слайд 11

Adaptivní modely časových řad Modely analytického vyrovnávání (pomocí trendových funkcí) přiřazují

Adaptivní modely časových řad

Modely analytického vyrovnávání (pomocí trendových funkcí) přiřazují všem

hodnotám časové řady stejné váhy a jsou tak vhodné zejména pro časové řady, které vykazují určitou permanentní deterministickou složku a náhodnými fluktuacemi nejsou výrazně ovlivňovány (ceteris paribus - princip stabilních vnějších podmínek).
V případě mnoha reálných ekonomických časových řad velmi často nereálný, může vést k selhání analytických modelů (není možné k popisu použít jednu matematickou funkci s konstantními parametry).
Pak se úspěchem uplatňují modely adaptivní, které předpokládají, že pro konstrukci extrapolační prognózy budoucího vývoje jsou nejcennější nejnovější pozorování časové řady. Proto jsou těmto nejnovějším pozorováním časové řady přiřazeny největší váhy a starší pozorování se buď úplně vyřazují ze zkoumání, nebo se jim přiřazují menší váhy ve srovnání s později pozorovanými hodnotami. Adaptivní modely tedy berou v úvahu stárnutí informací. Systém vah je tvořen pomocí tzv. vyrovnávacích konstant, které nabývají hodnot z intervalu < 0, 1 > a pro nalezení optimální hodnoty vyrovnávací konstanty se v praxi využívá „metody pokusů a omylů“. Za optimální hodnotu je považována ta hodnota, která minimalizuje vhodně zvolenou chybu odhadu (nejčastěji MSE). Statistický systém SAS, který bude v této práci využit pro efektivní realizaci všech potřebných analýz, provádí odhad hodnoty vyrovnávací konstanty automaticky.
Слайд 12

Brownovy modely expon. vyrovnávání Důležitou podtřídou adaptivních modelů jsou tzv. Brownovy

Brownovy modely expon. vyrovnávání

Důležitou podtřídou adaptivních modelů jsou tzv. Brownovy modely

exponenciálního vyrovnávání. S využitím těchto modelů je odhad trendu získáván ve formě lineární kombinace všech dosavadních pozorování časové řady s tím, že je uvažováno stárnutí informací, tzn. váhy dřívějších pozorování exponenciálně klesají. V rámci této techniky je (z hlediska použité vyrovnávací křivky) možné rozlišit 3 základní varianty, a to jednoduché exponenciální vyrovnávání (krátká období/úseky čas. Řady, v nichž je trend konstantní), dvojité (trend lineární) a trojité exponenciální vyrovnávání (trend kvadratický).
Zmíněné Brownovy modely přináší v praktických aplikacích dobré výsledky.
Mezi další významné představitele exponenciálního vyrovnávání patří Holtův model exponenciálního vyrovnávání, model exponenciálního vyrovnávání s tlumeným lineárním trendem a Wintersův model exponenciálního vyrovnávání sezónních časových řad.
Слайд 13

Často používaným ukazatelem, který slouží k popisu stupně shody je index

Často používaným ukazatelem, který slouží k popisu stupně shody je index

resp. koeficient determinace, přičemž čím větší hodnota, tím je funkce pro popis vývoje zvoleného ukazatele vhodnější.
Moderní statistická metodologie standardně implementovaná v statistických programech:
M.E. – střední chyba odhadu
M.S.E. – střední kvadratická chyba odhadu
M.A.E. střední absolutní chyba odhadu
M.P.E. – střední procentuální chyba odhadu
M.A.P.E. – střední absolutní procentuální chyba odhadu – nejvyužívanější
Obecně za velmi vhodně použitý model je hodnota MAPE 10%, ale můžeme se setkat i se situacemi, kdy je požadována hodnota 5% či naopak větší např. 15%. Hodnota MAPE (respektive její výše) se pohybuje v závislosti na dané situaci.

Posouzení vhodnosti modelů ČŘ

Слайд 14

Periodická složka: ≤ 1 rok … sezónní složka St > 1

Periodická složka:
≤ 1 rok … sezónní složka St
> 1 rok …

cyklická složka Ct
Periodická složka bývá velmi často reprezentována sezónní složkou, tato se vyskytuje pouze v krátkodobých časových řadách.
Velmi důležitá je v tomto případě identifikace a popis sezónní složky. Vždy je potřeba identifikovat, zda je sezonní kolísání skutečně statisticky významné
(grafická analýza, výpočet klouzavých průměrů, autokorelační funkce, analýza periodogramu).
Sezónními vlivy se rozumí soubor přímých či nepřímých příčin, které se opakují.
Důsledkem působení sezónních vlivů na analyzovanou časovou řadu jsou tzv. sezónní výkyvy, tj. pravidelné výkyvy zkoumané čas. Řady nahoru a dolů vůči určitému „nesezónnímu“ normálnímu vývoji řady v průběhu let.
Intenzitu sezónního kolísání měříme pomocí absolutních sezónních odchylek nebo sezónních indexů.
Před vlastní analýzou časové řady (trendu) je potřeba časovou řadu očistit od periodického kolísání, které by mohlo maskovat charakter trendu časové řady – pak mluvíme o sezónním očišťování:
- aditivní model – od hodnot původní časové řady odčítáme sezónní odchylky
- multiplikativní model - hodnoty původní časové řady dělíme sezónním indexem.

Analýza periodických ČŘ

Слайд 15

Analýza časových řad se v podstatě provádí ve dvou základních fázích,

Analýza časových řad se v podstatě provádí ve dvou základních fázích,

jimiž jsou fáze interpolace časové řady a její následná extrapolace. Model, kterým byl popsán dosavadní vývoj, je možné využít ke stanovení budoucí úrovně sledovaného ukazatele.
Dva základní typy předpovědí: bodová a intervalová.
Každá předpověď je spojena s určitou chybou předpovědi. Případná chyba je tím větší, čím kratší je délka časové řady, čím nedokonalejší je popis uplynulého vývoje a čím vzdálenější je horizont předpovědi.
Přesnost předpovědí je možné hodnotit ex post pomocí tzv. pseudoprognóz. Jedná se o prognózu v časti časového období, kdy již známe skutečnost. Porovnáním skutečných a prognózovaných hodnot získáme charakteristiky, které hodnotí přesnost prognózy.
Mezi tyto charakteristiky patří mimo jiné například :
Relativní chyba prognózy (podíl absolutní chyby prognózy a skutečné hodnoty)
A Theilův koeficient nesouladu (odmocnina tohoto koeficientu se uvádí v procentech jako chyba prognózy).

Předpovědi časových řad

Слайд 16

Kombinované modely Zejména pokud by u vybraných nejlepších prognostických modelů bylo

Kombinované modely

Zejména pokud by u vybraných nejlepších prognostických modelů bylo dosaženo

výsledků, které se z hlediska zvoleného kritéria příliš neodlišují, bylo by vhodné zkonstruovat agregované předpovědi modelů
Tyto konstruují předpovědi ve formě určitých kombinací předpovědí poskytnutých jednotlivými individuálními modely.
Systém SAS nabízí možnost kombinování individuálních předpovědí ve formě jejich prostého nebo váženého aritmetického průměru s různým systémem vah (nabízené tzv.regresními váhy jistým způsobem penalizují předpovědi zatížené vyššími předpovědními chybami zvoleného hodnotícího kritéria).
Слайд 17

Hledání optimálního modelu (kandidáta) v systému SAS Navržení vhodných kandidátů pro

Hledání optimálního modelu (kandidáta) v systému SAS

Navržení vhodných kandidátů pro účely

modelování minulého vývoje sledovaných ukazatelů, případně pro účely tvorby extrapolačních předpovědí a jejich zhodnocení na základě vybraných hodnotících kritérií
Hledání optimálního modelu může být někdy velmi zdlouhavé.
Pro zrychlení tohoto procesu je možné využít režimu automatického výběru modelů procedury Time Series Forecasting Systém (TSFS), který je součastí systému SAS (modul ETS).
Modul ETS nabízí možnost diagnostikovat časovou řadu z hlediska přítomnosti trendu, sezónnosti či nutnosti logaritmické transformace dat. Režim automatického výběru modelů se pak při vyhledávání nejvhodnějšího modelu o tyto diagnostické testy opírá.