Сглаживание временных рядов методом простых скользящих средних. Проведение аналитического выравнивания временного ряда


Аналитическое выравнивание временного ряда представляет из себя построение аналитической функции, модели тренда. Для этого применяются различного рода функции: линейные, степные, параболические и т.д.

Параметры тренда определяются как и в случае линейной регрессии методом наименьших квадратов, где в качестве независимой переменной выступает время, а в качестве зависимой переменной - уровни временного ряда. Критерием отбора наилучшей формы тренда служит наибольшее значение коэффициента детерминации, критерии Фишера и Стьюдента.

Допустим, что некоторая теоретическая модель предполагает линейную зависимость одной из характеристик системы от других:

y = У i k i ·x i

(i - число независимых переменных). Задача заключается в следующем: при фиксируемых параметрах x и измеренных значениях y рассчитать вектор параметров k , удовлетворяющий некоторому критерию оптимальности.

В методе наименьших квадратов этим критерием является минимум суммы квадратов отклонений расчитанных значений y от наблюдаемых (экспериментальных):

min У i (y s,i - y i )І.

Чтобы найти минимум функции, это выражение надо продифференцировать по параметрам и приравнять нулю (условие минимума). В результате поиск минимума суммы квадратов сводиться в простым операциям с матрицами.

Если теоретическая модель представляет собой линейную зависимость от одного параметра (y = a + b ·x ), то решение выражается в виде простых формул:

Z = n Уx i І - (Уx i )І;

a = (Уy i Уx i І - Уy i x i Уx i ) / Z ; S a І = S y І Уx i І / Z ;

b = (n Уy i x i - Уy i Уx i ) / Z ; S b І = S y І n / Z ;

S y І = У(y s,i - y i )І / (n - 2)

(y s,i - рассчитанное значение, y i - эксперементально измеренное значение)

При расчете погрешностей предполагается, что точность значений x значительно превосходит точность измеряемых значений y , погрешность измерения которых подчиняется нормальному распределению.

Автокорреляция в остатках - корреляционная зависимость между значениями остатков за текущий и предыдущие моменты времени.

Линейные регрессионные модели с гомоскедастичными и гетероскедастичными, независимыми и автокоррелированными остатками. Как мы видим из привиденного выше, основное - это "очистка" временного ряда от случайных отклонений, т.е. оценивание математического ожидания. Отсюда естественным образом появляются более сложные модели. Например, дисперсия может зависеть от времени. Такие модели называют гетероскедастичными, а те, в которых нет зависимости от времени - гомоскедастичными. (Точнее говоря, эти термины могут относиться не только к переменной "время", но и к другим переменным.) В случае, если погрешности никак не связаны между собой автокорреляционная функция должна быть вырожденной - равняться 1 при равенстве аргументов и 0 при их неравенстве. Понятно, что для реальных временных рядов так бывает далеко не всегда. Если естественный ход изменений наблюдаемого процесса является достаточно быстрым по сравнению с интервалом между последовательными наблюдениями, то можно предсказать "затухания" автокорреляции" и получения практически независимых остатков, в противном случае остатки будут автокоррелированы.

Под идентификацией моделей обычно понимается выявление их структуры и оценивание параметров. Так как структура - это тоже параметр, хотя и нечисловой, то речь идет об одной из типовых задач эконометрики - оценивании параметров.

Наиболее просто решается задача оценивания для линейных (по параметрам) моделей с гомоскедастичными независимыми остатками. Восстановление зависимостей во временных рядах может быть проведено на основе методов наименьших квадратов и наименьших модулей, на случай временных рядов переносятся результаты, связанные с оцениванием необходимого набора регрессоров, в частности, легко получить предельное геометрическое распределение оценки степени тригонометрического полинома.

Тем не менее, на более общую ситуацию такого простого переноса делать не рекомендуется. Рассмотрим, например, в случае временного ряда с гетероскедастичными и автокоррелированными остатками снова можно воспользоваться общим подходом метода наименьших квадратов, однако система уравнений метода наименьших квадратов и, естественно, ее решение будут иными. Формулы будут отличаться. В связи с чем данный метод называется "обобщенный метод наименьших квадратов (ОМНК)"

Проанализируем эконометрическую модель временного ряда, описывающего рост индекса потребительских цен (индекса инфляции). Пусть I(t)- рост цен в месяц t. Тогда, по мнению некоторых экономистов, естественно предположить, что:

I(t)=cI(t-1)+a+dS(t-4)+

Где I(t-1) - рост цен в предыдущий месяц (а c- некоторый коэффициент затухания, предполагающий, что при отсутствии внешний воздействий рост цен прекратится), a- константа (она соответствует линейному изменению величины I(t)со временем), bS(t-4) - слагаемое, соответствующее влиянию эмиссии денег (т.е. увеличения объема денег в экономике страны, осуществленному Центральным Банком) в размере S(t-4) и пропорциональное эмиссии с коэффициентом b, причем это влияние проявляется не сразу, а через 4 месяца; наконец, - это неизбежная погрешность.

Модель, даже, несмотря на свою простоту, демонстрирует многие характерные черты гораздо более сложных эконометрических моделей. Во-первых, обратим внимание на то, что некоторые переменные определяются (рассчитываются) внутри модели, как I(t). Их называют эндогенными (внутренними). Другие задаются извне (это экзогенные переменные). Иногда, как в теории управления, среди экзогенных переменных, выделяют управляемые переменные - те, с помощью которых менеджер может привести систему в нужное ему состояние.

Во-вторых, в соотношении появляются переменные новых типов - с лагами, т.е. аргументы в переменных относятся не к текущему моменту времени, а к некоторым прошлым моментам.

В-третьих, составление эконометрической модели такого типа - это отнюдь не рутинная операция. Например, запаздывание именно на 4 месяца в связанном с эмиссией денег слагаемом - это результат достаточно сложной предварительной статистической обработки.

От решения этого вопроса зависит конкретная реализация процедуры метода наименьших квадратов.

С другой стороны, в модели (1) всего 3 неизвестных параметра, и постановку метода наименьших квадратов выписать нетрудно:

Далее рассмотри модель такого типа с большим числом эндогенных и экзогенных переменных, с лагами и сложной внутренней структурой. Иначе говоря, ниоткуда не следует, что существует хотя бы одно решение у такой системы. В связи с чем возникает не одна, а две проблемы. Существует ли хоть одно решение? Если да, то как найти наилучшее решение из возможных? (Это - проблема статистической оценки параметров.)

Обе задача достаточно сложны. Для решения обоих задач разработано множество методов, обычно достаточно сложных, лишь часть из которых имеет научное обоснование. В частности, достаточно часто пользуются статистическими оценками, не являющимися состоятельными (строго говоря, их даже нельзя назвать оценками).

Коротко опишем некоторые распространенные приемы при работе с системами линейных эконометрических уравнений.

Система линейных одновременных эконометрических уравнений. Чисто формально можно все переменные выразить через переменные, зависящие только от текущего момента времени. Например, в случае вышеприведенного уравнения достаточно положить

H(t)=I(t-1), G(t)=S(t-4)

Тогда уравнение пример вид

I(t)=cH(t)+a+bG(t)+

Отметим тут же возможность использования регрессионных моделей с переменной структурой путем введения фиктивных переменных. Данные переменные при одних значениях времени (скажем, начальных) принимают заметные значения, а при других - сходят на нет (становятся фактически равными 0). В результате формально (математически) одна и та же модель описывает совсем разные зависимости.

Как уже отмечалось выше, создана масса методов эвристического анализа систем эконометрических уравнений. Данные методы предназначены для решения тех или иных проблем, возникающих при попытках найти численные решения систем уравнений.

Одной из проблем является наличие априорных ограничений на оцениваемые параметры. Например, доходы домохозяйства могут быть потрачены либо на потребление, либо на сбережение. Отсюда, сумма долей этих двух видов трат априори равна 1. А в системе эконометрических уравнений эти доли могут участвовать независимо. Отсюда возникает мысль оценить их методом наименьших квадратов, не обращая внимания на априорное ограничение, а потом подкорректировать. Данный подход называется косвенным методом наименьших квадратов.

Двух шаговый метод наименьших квадратов заключается в том, что в приведенном методе производится оценка параметров отдельного уравнения системы, а не рассмотрение системы в целом. И так же трех шаговый метод наименьших квадратов применяется для оценки параметров системы одновременных уравнений в целом. Изначально к каждому уравнению применяется двух шаговый метод с единой целью оценить коэффициенты и погрешности каждого уравнения, а в дальнейшем построить оценку для ковариационной матрицы погрешностей. Затем для оценивания коэффициентов всей системы применяется обобщенный метод наименьших квадратов.

Менеджеру и экономисту не рекомендуется быть специалистом в области составления и решения систем эконометрических уравнений, даже с применением специальных программных обеспечений, однако, он должен быть проинформирован о возможности данного направления эконометрики, для того чтобы в случае производственной необходимости квалифицированно сформулировать задание для специалистов-эконометриков.

От оценивания тренда (основной тенденции) перейдем ко второй основной задаче эконометрики временных рядов - оцениванию периода (цикла).

Проблема гетероскедастичности. Для начала выделим стационарные модели. В них совместные функции распределения F(t 1 , t 2 ,…,t k) для любого числа моментов времени k, а потому и все перечисленные выше характеристики временного ряда не меняются со временем. В частности, математическое ожидание и дисперсия являются постоянными величинами, автокорреляционная функция зависит только от разности t-s. Временные ряды, не являющиеся стационарными, называются нестационарными.

Гетероскедастичность - свойство исходных, когда дисперсия ошибки зависит от номера наблюдения. На графике гетероскедастичность проявляется в том, что с увеличением или уменьшением порядкового номера измерения увеличивается рассеивание измерений около линии тренда. Это может привести к существенным погрешностям оценок коэффициентов уравнения регрессии. Гетероскедастичность возникает тогда, когда объекты как правило неоднородны. Существует несколько методов коррекции, решающих проблему гетероскедастичности. Наиболее эффективный из них - метод взвешенных наименьших квадратов.

Сущность метода чрезвычайно проста. Пусть исходная модель имеет вид

Тогда, делением каждого элемента системы на значение уt мы приходим к другой системе

где у t2 = у 2щ, взвешенная дисперсия;

Щt = n, n - число измерений.

Таким образом, с помощью этого преобразования мы устраняем гетероскедастичность.

Кроме того, логарифмирование исходных данных также в некоторых случаях снижает ошибки определения параметров модели, вызванные гетероскедастичностью.

Метод аналитического выравнивания заключается в построении уравнения регрессии, характеризующего зависимость уровней ряда от временной переменной.

Назначение сервиса . Сервис позволит прямо на сайте в онлайн-режиме провести аналитическое выравнивание ряда y t , проверить наличие гетероскедастичности и автокорреляции остатков тестом Дарбина-Уотсона (см. пример аналитического выравнивания по прямой).

Инструкция . Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word .

Количество строк (исходных данных)
",1);">

Чтобы привести нелинейные зависимости к линейной используют метод выравнивания (линеаризацию).

y = f(x) Преобразование Метод линеаризации
y = b x a Y = ln(y); X = ln(x) Логарифмирование
y = b e ax Y = ln(y); X = x Комбинированный
y = 1/(ax+b) Y = 1/y; X = x Замена переменных
y = x/(ax+b) Y = x/y; X = x Замена переменных. Пример
y = aln(x)+b Y = y; X = ln(x) Комбинированный
y = a + bx + cx 2 x 1 = x; x 2 = x 2 Замена переменных
y = a + bx + cx 2 + dx 3 x 1 = x; x 2 = x 2 ; x 3 = x 3 Замена переменных
y = a + b/x x 1 = 1/x Замена переменных
y = a + sqrt(x)b x 1 = sqrt(x) Замена переменных

В общем случае при аналитическом выравнивании используется метод наименьших квадратов:

Типичное задание. Произведите аналитическое выравнивание и выразите общую тенденцию развития розничного товарооборота торгового дома соответствующим аналитическим уравнением. Вычислите аналитические (выровненные) уровни ряда динамики и нанесите их на график вместе с фактическими данными.

Пример . По УР имеются данные о вводе в действие жилых домов и общежитий, тыс. м 2 . Для анализа динамики показателя ввода в действие жилых домов и общежитий вычислите:

  1. абсолютные приросты , темпы роста и темпы прироста по годам и к 1998 г., абсолютное содержание одного процента прироста. Полученные показатели представьте в виде таблицы;
  2. среднегодовые показатели - величину уровня ряда; абсолютный прирост темп роста и прироста. Сделайте выводы.
Постройте график динамики уровня ряда за период 1998 -2006 гг., проведите аналитическое выравнивание ряда (постройте математическую модель и график), сделайте прогноз на 2007 год.

Решение . Самая простая математическая модель представляет собой линейное уравнение тренда вида y = bt + a . Чтобы найти параметры этой модели, воспользуемся методом наименьших квадратов. Система уравнений будет иметь следующий вид:
a 0 n + a 1 ∑t = ∑y
a 0 ∑t + a 1 ∑t 2 = ∑y t

t y t 2 y 2 t y
1 186.9 1 34931.61 186.9
2 219 4 47961 438
3 257 9 66049 771
4 276.66 16 76540.2 1106.64
5 353.5 25 124962.25 1767.5
6 310.1 36 96162.01 1860.6
7 360.9 49 130248.81 2526.3
8 371.7 64 138160.89 2973.6
9 423.9 81 179691.21 3815.1
45 2759.66 285 894706.98 15445.64
Для наших данных система уравнений имеет вид:
9a 0 + 45a 1 = 2759.66
45a 0 + 285a 1 = 15445.64
Данную систему уравнений можно решить несколькими

Одним из наиболее распространенных способов моделирования тенденции временного ряда является построение аналитической функции (тренда, либо тренда с циклической или (и) сезонной компонентой) , характеризующей зависимость уровней ряда от времени. Этот способ называют аналитическим выравниванием временного ряда.

Для решения этой задачи вначале необходимо выбрать вид функции . Наиболее часто используются следующие функции:

· линейная -

· полиномиальная -

· экспоненциальная -

· логистическая -

· Гомперца -

Это весьма ответственный этап исследования. При выборе соответствующей функции используют содержательный анализ (который может установить характер динамики процесса), визуальные наблюдения (на основе графического изображения временного ряда). При выборе полиномиальной функции может быть применен метод последовательных разностей (состоящий в вычислении разностей первого порядка , второго порядка и т.д.), и порядок разностей, при котором они будут примерно одинаковыми, принимается за степень полинома.

Из двух функций предпочтение обычно отдается той, при которой меньше сумма квадратов отклонений фактических данных от расчетных на основе этих функций. Но этот принцип нельзя доводить до абсурда: так, для любого ряда из точек можно подобрать полином -ой степени, проходящей через все точки, и соответственно с минимальной – нулевой – суммой квадратов отклонений, но в этом случае, очевидно, не следует говорить о выделении основной тенденции, учитывая случайный характер этих точек. Поэтому при прочих равных условиях предпочтение следует отдавать более простым функциям.

Параметры основной тенденции можно определить, используя метод наименьших квадратов. При этом, значения временного ряда рассматриваются как зависимая переменная, а время - как объясняющая:

где – возмущения, удовлетворяющие основным предпосылкам регрессионного анализа, т.е. представляющие независимые и одинаково распределенные случайные величины, распределение которых предполагаем нормальным.

Согласно методу наименьших квадратов параметры прямой находятся из системы нормальных уравнений (2.5), в которой в качестве берем :

(7.10)

Учитывая, что значения переменной образуют натуральный ряд чисел от 1 до , суммы можно выразить через число членов ряда по известным в математике формулам:

(7.11)

В рассмотренном примере 2 на странице 79 система нормальных уравнений имеет вид:

,

откуда и уравнение тренда , т.е. спрос ежегодно увеличивается в среднем на 25,7 ед.

Проверим значимость полученного уравнения тренда по F -критерию на 5%-ном уровне значимости вычислим с помощью формулы (3.40) суммы квадратов:

а) обусловленную регрессией –

б) общую –

в) остаточную

Найдем значение статистики:

.

Так как , то уравнение тренда значимо.

Другим методом выравнивания (сглаживания) временного ряда, т.е. выделения неслучайной составляющей, является метод скользящих средних. Он основан на переходе от начальных значений членов ряда к их средним значениям на интервале времени, длина которого определена заранее. При этом сам выбранный интервал времени «скользит» вдоль ряда.

Получаемый таким образом ряд скользящих средних ведет себя более гладко, чем исходный ряд, из-за усреднения отклонений ряда.

Одним из наиболее распространенных способов моделирования временного ряда является построение тренда или аналитической функции, характеризующей зависимость уровней ряда от времени. Этот способ называют аналитическим выравниванием временного ряда. Для аналитического выравнивания могут применяться следующие функции: · линейная · гиперболическая ; · экспоненциальная · степенная · полиномы второго и более высоких порядков Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время, а в качестве зависимой переменной – фактические уровни временного ряда yt. Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации. Известно несколько способов определения типа трендов. К наиболее распространенным относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики, коэффициенты автокорреляции уровней ряда. Тип тренда можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейный тренд, то его соседние уровни тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейный тренд, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражен нелинейный тренд в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.

Верификация

Выбор наилучшего уравнения в случае, если ряд содержит нелинейный тренд, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации R 2 , значимость которого оценивается по критерию Фишера, и выбора уравнения тренда с максимальным значением скорректированного коэффициента детерминации. Реализация этого метода относительно проста при компьютерной обработке данных. При наличии неявного нелинейного тренда следует дополнять описанные выше методы выбора наилучшего уравнения тренда качественным анализом динамики изучаемого показателя, чтобы избежать ошибок спецификации при выборе вида тренда. Качественный анализ предполагает изучение проблем возможного наличия в исследуемом временном ряде поворотных точек и изменения темпов прироста, начиная с определенного момента (периода) времени под влиянием ряда факторов. В случае, если уравнение тренда выбрано неверно при больших значениях выборки (ошибка спецификации), результаты анализа и прогнозирования динамики временного ряда с использованием выбранного уравнения будут недостоверными.


Поскольку наибольшее значение коэффициента детерминации 0,98 имеет уравнение, заданное кубическим полиномом, то в качестве модели можно использовать это уравнение (рисунок 16). Однако значение коэффициента детерминации линейного тренда равно 0,96, что также дает право использовать его для прогноза. Как правило, при прогнозировании предпочтение отдается линейному тренду, если по качеству он незначительно уступает нелинейному.

Выпуск продукции
Годы

Рисунок 16 – Подбор линии тренда

Прогнозирование

Используя линию тренда (кубический полином), осуществляется прогноз выпуска продукции, который составит в 2011 г. 44 208 ед. Прогноз выпуска продукции по линейному тренду составит 38 214,5 ед. Заметим, что полином лучше описывает имеющуюся выборку, но прогнозное значение резко увеличивается по сравнению с наблюдаемыми значениями. Прогноз по линейному тренду более достоверен.

Вопросы для самоконтроля

1. Каково определение модели временного ряда?

2. Какие известны основные компоненты временного ряда?

3. Каковы основные цели исследования временных рядов?

4. Как использовать автокорреляционную функцию при анализе структуры временного ряда?

5. Как рассчитывается коэффициент автокорреляции пятого порядка?

6. Как строится коррелограмма?

7. Каков общий вид мультипликативной и аддитивной моделей временного ряда?

8. С какой целью проводится анализ структуры сезонных колебаний временного ряда?

9. Какие тесты используются для проверки гипотезы о структурной стабильности временного ряда?

10. В каком случае нарушается структурная стабильность временного ряда?

11. Что понимается под аналитическим выравниванием временного ряда?

12. Каковы известны наиболее распространенные модели, используемые для аналитического выравнивания временного ряда?

13. Что понимается под линеаризующими преобразованиями? Как они используются в МНК?

14. Как оценивается качество построенной модели?

15. Как осуществляется точечный прогноз по модели временного ряда?

Индивидуальное задание

Динамика выпуска продукции некоторого предприятия характеризуется данными, представленными в таблице 25 (в каждом варианте
к объему выпускаемой продукции надо прибавить число 120 × k , где k – порядковый номер студента в журнале группы). Выполните следующее:

· проанализируйте структуру временного ряда;

· проверьте гипотезу о структурной стабильности ряда;

· проведите аналитическое выравнивание временного ряда;

· сделайте прогноз на 2011 г.;

· оформите отчет.

Выбор редакции
12 января 2010 года в 16 часов 53 минуты крупнейшее за последние 200 лет землетрясение магнитудой 7 баллов в считанные минуты погубило,...

Незнакомец, советуем тебе читать сказку "Каша из топора" самому и своим деткам, это замечательное произведение созданное нашими предками....

У пословиц и поговорок может быть большое количество значений. А раз так, то они располагают к исследованиям большим и малым. Наше -...

© Зощенко М. М., наследники, 2009© Андреев А. С., иллюстрации, 2011© ООО «Издательство АСТ», 2014* * *Смешные рассказыПоказательный...
Флавий Феодосий II Младший (тж. Малый, Юнейший; 10 апр. 401 г. - † 28 июля 450 г.) - император Восточной Римской империи (Византии) в...
В тревожный и непростой XII век Грузией правила царица Тамара . Царицей эту великую женщину называем мы, русскоговорящие жители планеты....
Житие сщмч. Петра (Зверева), архиепископа ВоронежскогоСвященномученик Петр, архиепископ Воронежский родился 18 февраля 1878 года в Москве...
АПОСТОЛ ИУДА ИСКАРИОТ Апостол Иуда ИскариотСамая трагическая и незаслуженно оскорбленная фигура из окружения Иисуса. Иуда изображён в...
Когнитивная психотерапия в варианте Бека - это структурированное обучение, эксперимент, тренировки в ментальном и поведенческом планах,...