Анализ временных рядов. Аналитические и алгоритмические тренды. Сезонность

Содержание

Слайд 2

Введение в анализ временных рядов 2 Матрица «объект-свойство»: n = 1,

Введение в анализ временных рядов

2

Матрица «объект-свойство»:

n = 1, T > 1

– временные ряды (time series).
Если p = 1, то одномерный временной ряд, иначе – многомерный.
Для многомерного можно учитывать взаимодействие величин по прин-ципам прямой и обратной связи.

Будем рассматривать дискретные одномерные временные ряды с рав-ноотстоящими наблюдениями t2 – t1 = … = tT – tT–1 = Δt: y1, …, yT.

Главная задача: кратко- и среднесрочный прогноз.

Отличия от пространственной выборки:
Элементы временного ряда не являются одинаково распределенными.
Элементы временного ряда не являются статистически независимыми.

Слайд 3

Основные факторы, формирующие временной ряд 3 1. Долговременные – общая тенденция

Основные факторы,
формирующие временной ряд

3

1. Долговременные – общая тенденция изменения признака,

как прави-ло, монотонная. Моделируется некоторой регрессионной функцией, чаще всего полиномом или экспонентой. Tt – тренд.
2. Сезонные – периодические колебания, происходящие в определенное время года. Моделируются с помощью дамми-переменных или откло-нений от скользящего среднего. St – сезонность.
3. Циклические – долговременные циклы экономической, политичес-кой, демографической или иной природы. Часто имеют неопределен-ную, в т.ч. изменяющуюся длительность. Моделируются некоторыми периодическими функциями. ϕ t – цикл.
4. Случайные – остатки, не поддающиеся объяснению. Разделяются на шоковые скачкообразные изменения и малые случайные отклонения, которые можно моделировать. εt – случайные остатки.
Слайд 4

Основные задачи анализа временных рядов 4 Определить, какие факторы (долговременные, сезонные,

Основные задачи
анализа временных рядов

4

Определить, какие факторы (долговременные, сезонные, циклические, случайные)

присутствуют в модели.
Построить хорошие оценки для коэффициентов неслучайных функций Tt, St, ϕ t.
Подобрать модель, адекватно описывающую поведение остатков εt и оценить ее параметры.

Аддитивная и мультипликативная модель:

Примеры:

## Помесячные авиаперевозки – T, S, ϕ (?), ε.

## Фондовые индексы – T, ϕ, ε.
## Урожайность – T (?), ε.

Аккуратно с циклами: ## Кризис 1857, 1895, 1933, 1971, 2009 (38 лет!)

Слайд 5

Неслучайная составляющая временного ряда 5 Необходимо выявить (желательно автоматически) факт наличия

Неслучайная составляющая
временного ряда

5

Необходимо выявить (желательно автоматически) факт наличия / отсут-ствия неслучайной

(т.е. зависящей от t) составляющей.
H0: Eyt = a = const.
H0: Eyt ≠ const – возможны различные варианты конкретизации.

Проверка гипотезы о неизменности среднего:
1. Критерий серий, основанный на медиане –
выявляет монотонные зависимости
2. Критерий восходящих и нисходящих серий –
выявляет периодические зависимости.
3. Критерий Аббе.

Пример: курс доллара за 3 апреля – 16 мая 2018
57,29, 57,54, 57,76, 57,58, 57,83, 58,57, 62,37, 64,06, 62,07, 61,43,
62,28, 61,15, 61,55, 60,86, 61,32, 61,77, 61,66, 61,75, 62,60, 62,73,
62,00, 63,49, 63,20, 62,71, 63,01, 62,52, 61,74, 61,77, 61,92.

Слайд 6

Критерий серий, построенный на медиане 6 1. Переходим к вариационному ряду

Критерий серий,
построенный на медиане

6

1. Переходим к вариационному ряду (сортируем в порядке

возрастания):
y1 < y2 < … < yT.
2. Определяем выборочную медиану
3. На основе исходного ряда записываем серии из «+» и «–»:
«+», если yt > ymed, «–», если yt < ymed, yt = ymed не учитываются.
4. Вычисляются 2 характеристики:
γ (T) – общее число серий
(последовательностей подряд идущих плюсов и минусов),
τ (T) – протяженность самой длинной серии.
Если ряд неслучайный, γ (T) – достаточно мало, τ (T) – велико.
5. Если или ряд неслучайный с вероятностью ошибки α = 0,05.

Пример:
xmed = 61,77, γ (29) = 8 < 10,31, τ(29) = 8 > 4,86, ряд неслучайный.

Слайд 7

Критерий восходящих и нисходящих серий 7 1. На основе исходного ряда

Критерий восходящих
и нисходящих серий

7

1. На основе исходного ряда записываем серии из

«+» и «–»:
«+», если yt – yt–1 > 0, «–», если yt – yt–1 < 0,
yt = yt–1 – не учитываются.
2. Вычисляются 2 характеристики:
γ (T) – общее число серий
τ (T) – протяженность самой длинной серии.
Если ряд неслучайный, γ (T) – мало, τ (T) – велико.
3. Если или
ряд неслучайный с вероятностью ошибки α = 0,05.

Пример:
γ (29) = 17 > 14,69, τ(29) = 4 < 6, ряд случайный (нет периодических ко-лебаний, хотя может быть монотонная зависимость, выявленная преды-дущим критерием).

Слайд 8

Критерий Аббе (квадратов последовательных разностей) 8 1. Подсчитываем эмпирическое значение критерия

Критерий Аббе
(квадратов последовательных разностей)

8

1. Подсчитываем эмпирическое значение критерия
2. Находим критическую точку
3.

Если ряд неслучайный с вероятностью ошибки α = 0,05.

Замечание:
Рекомендуется использовать критерий Аббе для больших выборок (n>60)

Пример:
γ (29) = 0,54/3,69 = 0,147 < 0,704, ряд неслучайный.

Слайд 9

Полиномиальные тренды 9 Общая формула полиномиального тренда: p = 1 –

Полиномиальные тренды

9

Общая формула полиномиального тренда:
p = 1 – линейный тренд, постоянный

прирост;
p = 2 – квадратичный тренд, постоянное ускорение;
p = 3 – кубичный тренд, постоянное изменение ускорения (???)
Не рекомендуется использовать тренды высших степеней!
## Темпы роста инфляции стали сокращаться.

Пример «Динамика курса доллара с 3 апреля по 16 мая 2018»:

Слайд 10

Экспоненциальный тренд – наиболее используемый в экономике 10 Каков темп экономического

Экспоненциальный тренд –
наиболее используемый в экономике

10

Каков темп экономического роста в США

с 1929 г.?
Происходит ли восстановление после кризиса с учетом роста экономики на 2,6%, 2,9%, 1,5% и 2,3% в 2014-2017?

Единственный тренд, выявляющий постоянный темп относительного прироста во времени: экономический рост, уровень цен, выручка,…

5% / год = 132 раза /век, 10% / год = 13781 раз / век.

рост 3,5% в год.

Слайд 11

Аналитические тренды. Пример 11 Задача: выявить долгосрочную тенденцию, построив аналитическую функцию

Аналитические тренды. Пример

11

Задача: выявить долгосрочную тенденцию, построив аналитическую функцию от времени

T(t), поз-воляющую сделать долгосрочный прогноз.

Пример: имеется поквартальная динамика числа вла-дельцев смартфонов в России за 2013-2017 гг.

Линейный тренд: постоянный абсолютный прирост.

Квадратичный тренд: немонотонная зависимость.

Слайд 12

Аналитические тренды. Пример 12 Логарифмический тренд: наиболее медленный неог-раниченный рост, функция

Аналитические тренды. Пример

12

Логарифмический тренд: наиболее медленный неог-раниченный рост, функция определена только

для по-ложительных t, не очень понятна интерпретация.

Логарифмический тренд: модификация

Гиперболический тренд: модификация

Гиперболический тренд: насыщение, функция опре-делена только при положительных значениях t.

Экспоненциальный тренд: постоянный относитель-ный прирост.

Степенной тренд: постоянная эластичность, не очень понятна интерпретация для временных рядов!

Слайд 13

Аналитические тренды. Прогноз 13

Аналитические тренды. Прогноз

13

Слайд 14

Алгоритмические тренды. Скользящее среднее 14 Задача: сглаживание значений временного ряда по

Алгоритмические тренды.
Скользящее среднее

14

Задача: сглаживание значений временного ряда по m предыдущим, m

последующим и текущей точке для устранения краткосрочных колеба-ний и выявления тенденции:

wk – весовые коэффициенты,

Весовые коэффициенты для скользящего среднего обычно симметрич-ны (wk = w–k), однако традиционное для коэффициентов свойство неот-рицательности (wk ≥ 0) для скользящего среднего выполняется не всегда.

На практике в качестве скользящего среднего часто используют прос-тое среднее арифметическое, однако во многих случаях (когда предпо-лагаемый тренд отличен от линейного вида) оптимальные весовые коэффициенты не будут совпадать между собой.

Слайд 15

Наилучшие значения весовых коэффициентов wk 15 Наилучшие (в смысле МНК) значения

Наилучшие значения
весовых коэффициентов wk

15

Наилучшие (в смысле МНК) значения весовых коэффициентов выби-раем

в зависимости от ширины окна m и порядка аппроксимирующего полинома p.

Пример: скользящее среднее по 5 точкам при квадратичном тренде

Слайд 16

Вывод весовых коэффициентов для квадратичного полинома 16 Решение задачи поиска наилучших

Вывод весовых коэффициентов
для квадратичного полинома

16

Решение задачи поиска наилучших весовых коэффициентов рассмотрим

на примере p = 2, m = 2, т.е. для Tt = θ0 + θ1t + θ2 t 2.

Критерий метода наименьших квадратов:

Решение данной системы из 3 линейных уравнений:

Слайд 17

Определение скользящего среднего в краевых точках 17 По обычным формулам невозможно

Определение скользящего среднего
в краевых точках

17

По обычным формулам невозможно найти скользящее среднее

в первых m и последних m точках. Однако для коротких временных рядов эти значения могут быть очень важны. В этом случае:

– коэффициенты полинома степени p, построенного по пер-вым (2m+1) точкам.

– коэффициенты полинома степени p, построенного по пос-ледним (2m+1) точкам.

Для длинных временных рядов первые m и последние m значений скользящего среднего обычно не вычисляются.

Слайд 18

Определение скользящего среднего по четному числу точек 18 Скользящее среднее иногда

Определение скользящего среднего
по четному числу точек

18

Скользящее среднее иногда применяется для устранения

сезонных и иных циклических колебаний, и нам потребуется проводить усреднение по четному числу точек:
Помесячные данные, усреднение за год – 12 точек;
Поквартальные/посезонные данные, усреднение за год – 4 точки;
Почасовые данные, усреднение за сутки – 24 точки.

Простое усреднение по периоду, не равному циклу, дает смещенные оценки. Например, при летнем пике
завышает результаты;
занижает результаты.

Решение: крайние значения берем с вдвое меньшим весом.
Например, в случае линейного тренда
для усреднения по сезонам w–2 = w2 = 1/8, остальные wk =1/4,
для усреднения по месяцам w–6 = w6 = 1/24, остальные wk =1/12,
для усреднения по часам w–12 = w12 = 1/48, остальные wk =1/24.

Слайд 19

Экспоненциально взвешенное скользящее среднее 19 Скользящее среднее применялось для интерполяции данных

Экспоненциально взвешенное
скользящее среднее

19

Скользящее среднее применялось для интерполяции данных (усред-нения внутри диапазона

временного ряда). Если мы хотим осуществить прогноз, потребуются другие методы.
При экстраполяции важно дисконтирование наблюдений (последние более важны, чем более старые).
Для стационарного временного ряда (с неизменным средним и дис-персией) наилучший прогноз EMAt является решением задачи

Для длинных временных рядов EMAt ≈ λ⋅EMAt–1 + (1 – λ)⋅ yt .

Слайд 20

Сезонность и ее устранение с помощью скользящего среднего 20 Сезонность: –

Сезонность и ее устранение
с помощью скользящего среднего

20

Сезонность: – аддитивная форма,

мультипликативная форма.

Способы устранения сезонной компоненты:
Метод дамми-переменных.
Использование скользящего среднего.

Алгоритм:
Выравнивание ряда с помощью скользящего среднего по 4 сезонам, 12 месяцам и т.д.
Расчет сезонной компоненты St и ее корректировка (для аддитивной формы сезонность должна быть в среднем нулевой, для мультипли-кативной – единичной).
Устранение сезонной компоненты yt – St или yt / St .
Построение тренда Tt .
Получение прогнозных значений Tt + St или Tt ⋅ St .
Расчет ошибок εt , вычисление коэффициента детерминации.

Слайд 21

Численный пример. Аддитивная сезонность 21 Корректировка: Сезонность: Тренд: Точность модели:

Численный пример.
Аддитивная сезонность

21

Корректировка:

Сезонность:

Тренд:

Точность модели:

Слайд 22

Численный пример. Мультипликативная сезонность 22 Корректировка: Сезонность: Тренд: Точность модели:

Численный пример.
Мультипликативная сезонность

22

Корректировка:

Сезонность:

Тренд:

Точность модели: