Временной тренд

Содержание

Слайд 2

Временной тренд временного ряда – это гладкая функция, описывающая его долгосрочное

Временной тренд временного ряда – это гладкая функция, описывающая его долгосрочное

поведение. Выявление тренда во временных рядах метеорологических величин является важным и весьма распространенным этапом их анализа. Нахождение временного тренда – это задание вида этой функции и определение ее параметров (коэффициентов) по имеющимся значениям выборки исследуемого временного ряда. Вид функции, описывающей временной тренд, не определяется однозначно самим рядом и является некоторым условным объектом, использующимся для более полного понимания особенностей рассматриваемого процесса.
Слайд 3

Достаточно легко определить временной тренд, если члены временного ряда монотонно изменяются

Достаточно легко определить временной тренд, если члены временного ряда монотонно изменяются

во времени. (значения временного ряда устойчиво возрастают или устойчиво убывают). В этом случае наличие тренда часто хорошо видно на графике.
Слайд 4

Пример линейного временного тренда


Пример линейного временного тренда

Слайд 5

Пример нелинейного временного тренда (полином степени 5)


Пример нелинейного временного тренда (полином степени 5)

Слайд 6

Сложный случай - когда в поведении временного ряда не прослеживается длительная

Сложный случай - когда в поведении временного ряда не прослеживается длительная

монотонность. В этом случае необходимо осуществить проверку гипотезы о существовании устойчивого временного тренда на всем временном интервалес использованием критериев или тестов.

Точка бифуркации

Слайд 7

Наиболее простым видом функции, описывающей временной тренд, является линейная функция. Уравнение

Наиболее простым видом функции, описывающей временной тренд, является линейная функция.
Уравнение

линейного временного тренда может быть представлено следующей формулой:
,
где t – время; a0 и a1 – коэффициенты тренда; ε – ошибка трендовых составляющих.
Уравнение нелинейного (квадратичного) тренда:
Слайд 8

Коэффициенты уравнения тренда находятся методом наименьших квадратов. Сущность данного метода заключается


Коэффициенты уравнения тренда находятся методом наименьших квадратов.
Сущность данного метода заключается

в нахождении параметров модели, при которых минимизируется сумма квадратов отклонений фактических значений временного ряда от теоретических (по выбранному уравнению временного тренда), то есть:
,
где yi – значение, вычисленное по уравнению тренда;
– отклонение ε для каждого значения временного ряда (см рис.);
n – количество данных.
Рис. Понятие отклонения ε
Слайд 9

Проведя необходимые преобразования, получим для определения коэффициентов систему двух линейных уравнений


Проведя необходимые преобразования, получим для определения коэффициентов систему двух линейных уравнений

с двумя неизвестными а0 и а1.. Решение этой системы имеет следующий вид:
Слайд 10

Оценка «соответствия» временного тренда - коэффициент детерминации R2.


Оценка
«соответствия»
временного тренда - коэффициент детерминации R2.

Слайд 11

Коэффициент детерминации R2 позволяет оценить качество аппроксимации табличных данных выбранным видом


Коэффициент детерминации R2 позволяет оценить качество аппроксимации табличных данных выбранным

видом временного тренда, а величина (1 - R2) характеризует долю необъяснённой временным трендом дисперсии (дисперсию случайной ошибки модели временного тренда).
Термин R2 кроме коэффициента детерминации также носит следующие названия: достоверность аппроксимации, квадрат смешанной корреляции.
Слайд 12

Коэффициент детерминации R2 для табличных данных: и уравнения временного тренда определяется


Коэффициент детерминации R2 для табличных данных:
и уравнения временного тренда


определяется следующим соотношением:

Здесь
где суммирование по индексу i ведется от 1 до N.

Слайд 13

В зависимости от уровня коэффициента детерминации, принято разделять модели на три


В зависимости от уровня коэффициента детерминации, принято разделять модели

на три группы:
0,8 – 1 — модель хорошего качества;
0,5 – 0,8 — модель приемлемого качества;
0 – 0,5 — модель плохого качества.
В последнем случае качество модели говорит о невозможности её использования для прогноза.
Слайд 14

Основная проблема применения R2 заключается в том, что его значение увеличивается


Основная проблема применения R2 заключается в том, что его

значение увеличивается (не уменьшается) от добавления в модель новых переменных (в нашем случае – при повышении степени аппроксимирующего полинома), даже если эти переменные никакого отношения к объясняемой переменной не имеют!
Поэтому сравнение моделей с разным количеством факторов с помощью коэффициента детерминации, вообще говоря, некорректно.
Слайд 15

Для этих целей можно использовать альтернативные показатели. Например, использовать при полиномиальной


Для этих целей можно использовать альтернативные показатели.
Например, использовать при

полиномиальной аппроксимации скорректированным коэффициентом детерминации:
r2 = 1 - (1 - R2 )*[n/(n - k)] ,
где n - число наблюдений; k - число оцениваемых параметров (коэффициентов) аппроксимирующего временной тренд полинома.
Слайд 16

Интерпретация составляющих коэффициента детерминации R2 Коэффициент детерминации R2 показывает, на сколько


Интерпретация составляющих коэффициента детерминации R2
Коэффициент детерминации R2 показывает, на сколько процентов

(R2 *100) найденная функция тренда описывает связь между исходными значениями факторов x и y (в нашем случае времени и метеорологического параметра)
где числитель  – объясненная временная изменчивость метеорологической величины за рассматриваемый промежуток времени (ее вариация);  знаменатель – общая временная изменчивость (наблюдаемая вариация).
Слайд 17

Графическая интерпретация значений слагаемых в числителе и знаменателе в формуле для

Графическая интерпретация значений слагаемых в числителе и знаменателе в формуле для

коэффициента детерминации R2 для случая линейного временного тренда (x это время t): f(x) = a0 + a1*x
Слайд 18

Оценка значимости коэффициентов линейного временного тренда

Оценка значимости коэффициентов линейного временного тренда


Слайд 19

При определении временного линейного тренда важно оценить его значимость, т.е. насколько

При определении временного линейного тренда важно оценить его значимость, т.е. насколько

обоснован его вклад в описание изменчивости временного процесса, поскольку вклад тренда в общую дисперсию временного ряда может быть как значимым, так и незначимым.
Слайд 20

Алгоритм оценки значимости линейного временного тренда: Рассчитывается коэффициент детерминации R2, по

Алгоритм оценки значимости линейного временного тренда:
Рассчитывается коэффициент детерминации R2, по величине

которого определяется коэффициент корреляции r между линейным трендом и фактическим рядом:
Рассчитывается эмпирическое значение критерия Стьюдента:
3. Определяется критическое значение критерия Стьюдента на уровне значимости α: tкр (α, N – 1) = СТЬЮДРАСПОБР (1 - α, N – 1) .
4. Если выполняется неравенство
то линейный тренд значим.
Слайд 21

АЛГОРИТМ ВЫЯВЛЕНИЯ ЛОКАЛЬНЫХ ТРЕНДОВ ПРИ АНАЛИЗЕ МЕТЕОРОЛОГИЧЕСКИХ ВРЕМЕННЫХ РЯДОВ

АЛГОРИТМ
ВЫЯВЛЕНИЯ
ЛОКАЛЬНЫХ ТРЕНДОВ
ПРИ АНАЛИЗЕ МЕТЕОРОЛОГИЧЕСКИХ ВРЕМЕННЫХ РЯДОВ

Слайд 22

График среднесуточной температуры воздуха в СПб за 1994-1995 гг График температуры

График среднесуточной температуры воздуха в СПб за 1994-1995 гг

График температуры воздуха

в СПб с дискретностью 15 мин за 2 суток: R2 = 0.008
Слайд 23

Определение границ локальных участков временного ряда, имеющие устойчивые тенденции к изменению

Определение границ локальных участков временного ряда, имеющие устойчивые тенденции к изменению

с целью последующего расчета в них временного тренда не является тривиальной задачей.
Одним из подходов к решению задачи выделения во временном ряде локальных временных отрезков ∆i с устойчивыми тенденциями является его визуализация (построения графиков). Однако такой подход весьма субъективен, а при значительной длительности временного ряда - весьма трудоемок.

∆1

∆2

∆3

∆4

∆5

∆6

Слайд 24

Рассмотрим возможности использования известного и весьма простого подхода к автоматизации решения

Рассмотрим возможности использования известного и весьма простого подхода к автоматизации решения

задачи определении параметров локальных трендов внутри временного ряда.
Слайд 25

Пусть имеется регулярный временной ряд, который представим в следующем виде: Pi

Пусть имеется регулярный временной ряд, который представим в следующем виде:
Pi =

P(τi) , (1)
где
i – порядковый номер члена временного ряда: i = 1, 2, … , N,
τi = τ0 + Δ τ * i,
τ0 – начальный момент проведения измерений,
Δτ - дискретность измерений (временной интервал между измерениями).
Для выделения «локальных» по своей тенденции участков временного ряда необходимо сформировать вспомогательный временной ряд
rj = R(τj) , j = 1, 2, … , N, (2)
значения которого будут индикаторами наблюдающейся тенденции.
Слайд 26

Алгоритм определения значения индикатора, позволяющего выделить «монотонные» по своей тенденции участки

Алгоритм определения значения индикатора, позволяющего выделить «монотонные» по своей тенденции участки

временного ряда, заключается в следующем.
Задается протяженность контрольных участков временного ряда, каждый из которых состоит из nk членов: параметр d.
Значение параметра nk= d достаточно просто подобрать в процессе проведения нескольких численных экспериментов при апробации предлагаемого алгоритма для рассматриваемого временного ряда.
2. Для первого (j = 1) контрольного участка с использованием членов временного ряда с номерами от n1 = 1 до n2 = nk вычисляется среднее значение:
s(n1, n2, nk = d ) = sj, j = 1 .
Слайд 27

3. Задается параметр g - протяженность последовательно анализируемых участков временного ряда,

3. Задается параметр g - протяженность последовательно анализируемых участков временного ряда,

т.е. анализируемых на наличие устойчивой тенденции участков временного ряда.
Именно эти отрезки временного ряда будут использоваться для оценки наличия или отсутствия на этом участке временного тренда по данным для контрольного участка временного ряда.
Слайд 28

Начало работы алгоритма: n1 = 1, n2 = 117, d =117,

Начало работы алгоритма: n1 = 1, n2 = 117, d =117,

g = 30; определяется значение r118

d

g

Контрольный участок

Контролируемый на наличие устойчивой тенденции к изменению участок

Слайд 29

4. Проверяется выполнение одного из следующих трех условий для всех значений

4. Проверяется выполнение одного из следующих трех условий для всех значений

временного ряда, начиная со значения от n2 до значения n2+ g, для определения на этом промежутке значения индикатора характера протекающего процесса r :
а) вариант 1 - все значения временного ряда с номерами i = (n2 ÷ n2 + g) больше или равны ранее вычисленного для контрольного участка среднего значения s(n1, n2, d) : в этом случае параметру rj с номером j = n2 + 1 присваивается значение rj = +1, что является индикатором того, что на анализируемом участка протяженностью в g значения члены временного ряда в среднем возрастают;
б) вариант 2 - все значения временного ряда с номерами i = (n2 ÷ n2 + g) меньше значению s(n1, n2, d): параметр rj = −1 для j = n2 + 1, значения членов временного ряда в среднем уменьшаются;
в) вариант 3 - все значения временного ряда с номерами i = (n2 ÷ n2 + g) не удовлетворяют ни одному из условий а) или б) : параметр rj = 0 для номера j = n2 + 1, значения членов временного ряда в среднем не меняются.
Слайд 30

5. Полученное на этапе 4 значение rj присваивается n2 + 1

5. Полученное на этапе 4 значение rj присваивается n2 + 1

элементу вспомогательного ряда R:
R(τj) = rj, j = n2 + 1. (3)
6. Значения n1 и n2 увеличиваются на 1 и если выполняется условие
( n2 + g ) < N, (4)
то повторяется выполнение пунктов 4 и 5.
Слайд 31

Иллюстрация работы алгоритма: n1 = 59, n2 = 175, d =117,

Иллюстрация работы алгоритма: n1 = 59, n2 = 175, d =117,

g = 30; определяется значение r176

d

g

Контрольный участок

Контролируемый на наличие устойчивой тенденции к изменению участок

Слайд 32

Таким образом, в процессе реализации данного алгоритма определяются все значения вспомогательного


Таким образом, в процессе реализации данного алгоритма определяются все значения вспомогательного

ряда R с номерами от i = d + 1 до i = N.
При этом для удобства дальнейшего анализа значениям вспомогательного ряда R(τi) с номерами от i = 1 до i =  d можно присвоить значения 1.5, что будет индикатором того, что для этих членов временного ряда Р(τi) индикатор характера протекающего процесса не определялся.
Слайд 33

Следовательно, после реализации приведенного алгоритма значения вспомогательного ряда могут принимать 4


Следовательно, после реализации приведенного алгоритма значения вспомогательного ряда могут принимать 4

значения:
+1, −1, 0 и 1.5.
Значения +1 соответствуют наличию устойчивой тенденции к увеличению значений временного ряда с того номера, где это значение записано.
Значение −1 будет указывать на наличие тенденции к уменьшению значений временного ряда/
Значение 0 – на относительное стабильное поведение членов временного ряда, а значение 1.5 в начале вспомогательного ряда будет показывать протяженность контрольных участков (на этом участке тенденции не определяются).
Слайд 34

В заключении отметим, что рассмотренный алгоритм можно рекомендовать к использованию при

В заключении отметим, что рассмотренный алгоритм можно рекомендовать к использованию при

анализе временных рядов метеорологических величин различной природы и имеющих различную дискретность. Однако при этом следует учитывать тот факт, что значения входящих в алгоритм параметров d и g (особенно d) не являются универсальными и требуют «настройки» в зависимости от решаемой задачи.
Этот недостаток не является принципиальным, поскольку легко преодолевается путем проведения численных экспериментов с использованием небольшого отрезка исследуемого ряда, в результате которых варьируются указанные параметры и на основе полученных результатов определяются оптимальные значения.
Слайд 35

Программа «Процесс-#.xls» .

Программа «Процесс-#.xls» .

Слайд 36

Информационные сообщения программы «Процесс-19»

Информационные сообщения программы «Процесс-19»

Слайд 37

Результат работы программы «Процесс-19»

Результат работы программы «Процесс-19»

Слайд 38

Тестовая проверка программы «Процесс-19»: графики с данными колонок А и В

Тестовая проверка программы «Процесс-19»: графики с данными колонок А и В

Слайд 39

Программа «Процесс-14»: графики с данными колонок А и В, колонок В и С.

Программа «Процесс-14»: графики с данными колонок А и В, колонок В

и С.
Слайд 40

Проиллюстрируем работу данного алгоритма на временном ряде температуры воздуха, полученных с

Проиллюстрируем работу данного алгоритма на временном ряде температуры воздуха, полученных с

помощью АМС с дискретностью 15 мин в Санкт-Петербурге (Excel, «Книга Процесс-14»).

Первые 25 членов этого вспомогательного ряда имеют значения, равные 1.5, т.е. это те значения, для которых по приведенному алгоритму не определялись значения параметра r.

r = 1.5

Слайд 41

Далее следуют члены ряда с номерами 26 ÷ 54, имеющие значения

Далее следуют члены ряда с номерами 26 ÷ 54, имеющие значения

+1, т.е. на этом участке алгоритм выявил тенденцию к росту температуры воздуха. Считая этот участок квазиоднородным, строим для него линейный тренд, для которого R2 = 0.76 (ранее для всего ряда R2 = 0.0008 ).

R2 = 0.76

r = +1

Слайд 42

Члены ряда с номерами 55 ÷ 58 равны 0, т.е. алгоритм

Члены ряда с номерами 55 ÷ 58 равны 0, т.е. алгоритм

не выявил на этом участке никаких тенденций, а члены ряда с номерами 59 ÷ 104 имеют значения −1, что указывает на тенденцию к уменьшению значений температуры воздуха на этом временном промежутке (R2 = 0.97).
Слайд 43

Графики временного ряда температуры (красная кривая) и вспомогательного временного ряда r

Графики временного ряда температуры (красная кривая) и вспомогательного временного ряда

r (синие линии).
Для наглядности не произведено объединение коротких отрезков значений параметра r = 0: такие короткие отрезки при объединении делятся на две равные части и каждой из них приписываются значения индекса r справа и слева от этих частей короткого отрезка.
Слайд 44

Слайд 45

Этапы анализа временного ряда: 1. Анализ качества временного ряда – отсутствие

Этапы анализа временного ряда:

1. Анализ качества временного ряда – отсутствие временных

разрывов и «выбросов».
2. Анализ основных статистических характеристик временного ряда.
3. Проверка временного ряда на стационарность.
4. Проверка наличия тренда (глобального и локальных) и определение их параметров.
5. Спектральный анализ.
6. Выделение случайной стационарной составляющей на основе исключения временного тренда и периодических составляющих.
7. Анализ вида распределения на основе построения эмпирической функции распределения (гистограммы).
8. Анализ автокорреляционной функции временного ряда.
9.Построения и анализ математической модели текущего прогнозирования.