Под временными рядами понимают экономические величины, зависящие от времени. При этом время предполагается дискретным, в противном случае говорят о случайных процессах, а не о временных рядах.
6.1. Модели стационарных и нестационарных временных рядов,
их идентификация
Пусть Рассмотрим временной ряд X(t). Пусть сначала временной ряд принимает числовые значения. Это могут быть, например, цены на батон хлеба в соседнем магазине или курс обмена доллара на рубли в ближайшем обменном пункте. Обычно в поведении временного ряда выявляют две основные тенденции - тренд и периодические колебания.
При этом под трендом понимают зависимость от времени линейного, квадратичного или иного типа, которую выявляют тем или иным способом сглаживания (например, экспоненциального сглаживания) либо расчетным путем, в частности, с помощью метода наименьших квадратов. Другими словами, тренд - это очищенная от случайностей основная тенденция временного ряда.
Временной ряд обычно колеблется вокруг тренда, причем отклонения от тренда часто обнаруживают правильность. Часто это связано с естественной или назначенной периодичностью, например, сезонной или недельной, месячной или квартальной (например, в соответствии с графиками выплаты заплаты и уплаты налогов). Иногда наличие периодичности и тем более ее причины неясны, и задача эконометрика - выяснить, действительно ли имеется периодичность.
Элементарные методы оценки характеристик временных рядов обычно достаточно подробно рассматриваются в курсах "Общей теории статистики" (см., например, учебники [1,2]), поэтому нет необходимости подробно разбирать их здесь. (Впрочем, о некоторых современных методах оценивания длины периода и самой периодической составляющей речь пойдет ниже.)
Характеристики временных рядов. Для более подробного изучения временных рядов используются вероятностно-статистические модели. При этом временной ряд X(t) рассматривается как случайный процесс (с дискретным временем) основными характеристиками являются математическое ожидание X(t), т.е.
,
дисперсия X(t), т.е.
и автокорреляционная функция временного ряда X(t)
т.е. функция двух переменных, равная коэффициенту корреляции между двумя значениями временного ряда X(t) и X(s).
В теоретических и прикладных исследованиях рассматривают широкий спектр моделей временных рядов. Выделим сначала стационарные модели. В них совместные функции распределения для любого числа моментов времени k, а потому и все перечисленные выше характеристики временного ряда не меняются со временем. В частности, математическое ожидание и дисперсия являются постоянными величинами, автокорреляционная функция зависит только от разности t-s. Временные ряды, не являющиеся стационарными, называются нестационарными.
Линейные регрессионные модели с гомоскедастичными и гетероскедастичными, независимыми и автокоррелированными остатками. Как видно из сказанного выше, основное - это "очистка" временного ряда от случайных отклонений, т.е. оценивание математического ожидания. В отличие от простейших моделей регрессионного анализа, рассмотренных в главе 5, здесь естественным образом появляются более сложные модели. Например, дисперсия может зависеть от времени. Такие модели называют гетероскедастичными, а те, в которых нет зависимости от времени - гомоскедастичными. (Точнее говоря, эти термины могут относиться не только к переменной "время", но и к другим переменным.)
Далее, в главе 5 предполагалось, что погрешности независимы между собой. В терминах настоящей главы это означало бы, что автокорреляционная функция должна быть вырожденной - равняться 1 при равенстве аргументов и 0 при их неравенстве. Ясно, что для реальных временных рядов так бывает отнюдь не всегда. Если естественный ход изменений наблюдаемого процесса является достаточно быстрым по сравнению с интервалом между последовательными наблюдениями, то можно ожидать "затухания" автокорреляции" и получения практически независимых остатков, в противном случае остатки будут автокоррелированы.
Идентификация моделей. Под идентификацией моделей обычно понимают выявление их структуры и оценивание параметров. Поскольку структура - это тоже параметр, хотя и нечисловой (см. главу 8), то речь идет об одной из типовых задач эконометрики - оценивании параметров.
Проще всего задача оценивания решается для линейных (по параметрам) моделей с гомоскедастичными независимыми остатками. Восстановление зависимостей во временных рядах может быть проведено на основе методов наименьших квадратов и наименьших модулей, рассмотренных в главе 5 моделей линейной (по параметрам) регрессии. На случай временных рядов переносятся результаты, связанные с оцениванием необходимого набора регрессоров, в частности, легко получить предельное геометрическое распределение оценки степени тригонометрического полинома.
Однако на более общую ситуацию такого простого переноса сделать нельзя. Так, например, в случае временного ряда с гетероскедастичными и автокоррелированными остатками снова можно воспользоваться общим подходом метода наименьших квадратов, однако система уравнений метода наименьших квадратов и, естественно, ее решение будут иными. Формулы в терминах матричной алгебры, о которых упоминалось в главе 5, будут отличаться. Поэтому рассматриваемый метод называется "обобщенный метод наименьших квадратов (ОМНК)" (см., например, [3, с.212]).
Замечание. Как уже отмечалось в главе 5, простейшая модель метода наименьших квадратов допускает весьма далекие обобщения, особенно в области системам одновременных эконометрических уравнений для временных рядов. Для понимания соответствующей теории и алгоритмов необходимо профессиональное владение матричной алгеброй. Поэтому мы отсылаем тех, кому это интересно, к литературе по системам эконометрических уравнений [4-9] и непосредственно по временным рядам [10-25], в которой особенно много интересуются спектральной теорией, т.е. выделением сигнала из шума и разложением его на гармоники. Подчеркнем в очередной раз, что за каждой главой настоящей книги стоит большая область научных и прикладных исследований, вполне достойная того, чтобы посвятить ей много усилий. Однако из-за ограниченности объема книги мы вынуждены изложение сделать конспективным.
6.2. Системы эконометрических уравнений
Пример модели авторегрессии. В качестве первоначального примера рассмотрим эконометрическую модель временного ряда, описывающего рост индекса потребительских цен (индекса инфляции). Пусть I(t) - рост цен в месяц t (подробнее об этой проблематике см. главу 7). Тогда по мнению некоторых экономистов естественно предположить, что
I(t) = сI(t- 1) + a + b S (t - 4) + e, (1)
где I(t- 1) - рост цен в предыдущий месяц (а с - некоторый коэффициент затухания, предполагающий, что при отсутствии внешний воздействий рост цен прекратится), a - константа (она соответствует линейному изменению величины I(t) со временем), b S (t - 4) - слагаемое, соответствующее влиянию эмиссии денег (т.е. увеличения объема денег в экономике страны, осуществленному Центральным Банком) в размере S (t - 4) и пропорциональное эмиссии с коэффициентом b, причем это влияние проявляется не сразу, а через 4 месяца; наконец, e - это неизбежная погрешность.
Модель (1), несмотря на свою простоту, демонстрирует многие характерные черты гораздо более сложных эконометрических моделей. Во-первых, обратим внимание на то, что некоторые переменные определяются (рассчитываются) внутри модели, как I(t). Их называют эндогенными (внутренними). Другие задаются извне (это экзогенные переменные). Иногда, как в теории управления, среди экзогенных переменных, выделяют управляемые переменные - те, с помощью которых менеджер может привести систему в нужное ему состояние.
Во-вторых, в соотношении (1) появляются переменные новых типов - с лагами, т.е. аргументы в переменных относятся не к текущему моменту времени, а к некоторым прошлым моментам.
В-третьих, составление эконометрической модели типа (1) - это отнюдь не рутинная операция. Например, запаздывание именно на 4 месяца в связанном с эмиссией денег слагаемом b S (t - 4) - это результат достаточно изощренной предварительной статистической обработки. Далее, требует изучения вопрос зависимости или независимости величин S (t - 4) и I(t). От решения этого вопроса зависит, как выше уже отмечалось, конкретная реализация процедуры метода наименьших квадратов.
С другой стороны, в модели (1) всего 3 неизвестных параметра, и постановку метода наименьших квадратов выписать нетрудно:
Проблема идентифицируемости. Представим теперь модель тапа (1) с большим числом эндогенных и экзогенных переменных, с лагами и сложной внутренней структурой. Вообще говоря, ниоткуда не следует, что существует хотя бы одно решение у такой системы. Поэтому возникает не одна, а две проблемы. Есть ли хоть одно решение (проблема идентифицируемости)? Если да, то как найти наилучшее решение из возможных? (Это - проблема статистической оценки параметров.)
И первая, и вторая задача достаточно сложны. Для решения обоих задач разработано множество методов, обычно достаточно сложных (см. список литературы), лишь часть из которых имеет научное обоснование. В частности, достаточно часто пользуются статистическими оценками, не являющимися состоятельными (строго говоря, их даже нельзя назвать оценками).
Коротко опишем некоторые распространенные приемы при работе с системами линейных эконометрических уравнений.
Система линейных одновременных эконометрических уравнений. Чисто формально можно все переменные выразить через переменные, зависящие только от текущего момента времени. Например, в случае уравнения (1) достаточно положить
H(t) = I(t- 1), G(t) = S (t - 4).
Тогда уравнение пример вид
I(t) = сH(t) + a + b G(t) + e. (2)
Отметим здесь же возможность использования регрессионных моделей с переменной структурой путем введения фиктивных переменных. Эти переменные при одних значениях времени (скажем, начальных) принимают заметные значения, а при других - сходят на нет (становятся фактически равными 0). В результате формально (математически) одна и та же модель описывает совсем разные зависимости.
Косвенный, двухшаговый и трехшаговый методы наименьших квадратов. Как уже отмечалось, разработана масса методов эвристического анализа систем эконометрических уравнений. Они предназначены для решения тех или иных проблем, возникающих при попытках найти численные решения систем уравнений.
Одна из проблем связана с наличием априорных ограничений на оцениваемые параметры. Например, доход домохозяйства может быть потрачен либо на потребление, либо на сбережение. Значит, сумма долей этих двух видов трат априори равна 1. А в системе эконометрических уравнений эти доли могут участвовать независимо. Возникает мысль оценить их методом наименьших квадратов, не обращая внимания на априорное ограничение, а потом подкорректировать. Такой подход называют косвенным методом наименьших квадратов.
Двухшаговый метод наименьших квадратов состоит в том, что оценивают параметры отдельного уравнения системы, а не рассматривают систему в целом. В то же время трехшаговый метод наименьших квадратов применяется для оценки параметров системы одновременных уравнений в целом. Сначала к каждому уравнению применяется двухшаговый метод с целью оценить коэффициенты и погрешности каждого уравнения, а затем построить оценку для ковариационной матрицы погрешностей, После этого для оценивания коэффициентов всей системы применяется обобщенный метод наименьших квадратов (см. выше).
Менеджеру и экономисту не следует становиться специалистом по составлению и решению систем эконометрических уравнений, даже с помощью тех или иных программных систем, но он должен быть осведомлен о возможностях этого направления эконометрики, чтобы в случае производственной необходимости квалифицированно сформулировать задание для специалистов-эконометриков.
От оценивания тренда (основной тенденции) перейдем ко второй основной задаче эконометрики временных рядов - оцениванию периода (цикла).
6.3. Оценивание длины периоды и периодической составляющей
В настоящем пункте рассмотрим достаточно широкий класс практически полезных непараметрических оценок длины периода и периодической составляющей во временных рядах. Из общих результатов статистики объектов нечисловой природы (см. главу 8) вытекает состоятельность этих оценок.
Начнем с того, что во многих прикладных задачах рассматривают временной ряд (или случайный процесс) y(t)=x(t)+e(t), где x(t) - детерминированная периодическая функция от времени t, т.е. x(t)=x(t+T) при некотором T, где T - длина периода (минимальная из возможных, поскольку 2T, 3T, 4T - тоже, как легко видеть, длины периодов), а e(t) - “шумы”, случайные погрешности, искажающие периодический сигнал. Требуется оценить (минимальную) длину периода T и периодическую составляющую x(t). При этом не предполагается, что функция x(t) входит в какое-либо параметрическое семейство, например, конечных сумм синусов и косинусов, т.е. рассматривается задача непараметрического оценивания (минимальной) длины периода и периодической составляющей сигнала.
Приведем примеры прикладных постановок.
1. По акустическим сигналам необходимо установить тип двигателя (и его национальную принадлежность). Предполагается, что двигатели различаются по длине периода и виду основного периодического сигнала. Процедура идентификации основана на оценивании длины периода и периодической составляющей регистрируемого сигнала. Очевидна важность такой задачи при быстрой технической диагностике. В частности, высокая производительность, а потому и высокая экономическая эффективность при ремонте впрямую зависят от умения решать поставленную задачу.
2. В предположении цикличности экономических процессов требуется по статистическим данным установить длину цикла и на основе вида периодической составляющей построить прогноз, например, прогноз урожайности, емкости рынка тех или иных товаров или экономической активности в целом. В экономической литературе часто говорят об экономических циклах, но почти никогда не дают строгого определения понятия цикла. (Под строгим определением понимаем такое, согласно которому можно отличить "цикл" от "не цикла", можно выделить начало и конец цикла, отделить один цикл от другого, короче, однозначно выделить цикл как самостоятельный объект экономического изучения.)
3. По мнению авторов работы [26], для среднесрочного прогнозирования развития социокультурной сферы (социально-политического “климата”, живописи, музыки, архитектуры, поэзии и т.д.) необходимо выявить ее цикличность с помощью объективных измерений на базе субъективных первичных данных (т.е. на базе оценок экспертов).
4. В исторических событиях, описываемых согласно распространенной в настоящее время т.н. скалигеровской хронологии, автор работы [27] обнаруживает цикличность. Эта цикличность полностью объясняется новой статистической хронологией (см., например, [28]), построенной с помощью специальных методов статистики объектов нечисловой природы (см. главу 8), предназначенных для анализа текстов исторических хроник, и одновременно служит еще одним подтверждением новой статистической хронологии.
Описание метода оценивания. Пусть рассматриваемые функции y(t), x(t), e(t) определены на отрезке [0; А]. При фиксированном Т рассмотрим “куски” сигнала y(t) на последовательных отрезках длины Т, т.е. на отрезках [0;Т], [Т;2Т], [2Т;3Т], ... Удобно ввести последовательность функций на отрезке [0;Т], полученную сдвигами этих кусков к началу координат:
y1(t)=y(t), y2(t)=y(t+Т), y3(t)=y(t+2Т), ...
Все они определены на отрезке [0;Т]. Число этих функций равно числу полных периодов длины Т, укладывающихся на отрезке [0;А], т.е. равно целой части числа А/Т. Отметим еще раз, что если Т - период, то 2Т, 3Т, 4Т, ... - тоже периоды. В дальнейшем из всех периодов будем рассматривать и оценивать, как правило, только наименьший.
Если Т=Т0 - истинный период (или кратный ему) и погрешности e(t) отсутствуют, то все введенные в предыдущем абзаце функции совпадают между собой и с периодической составляющей:
x(t)=y1(t)=y2(t)=y3(t)=...
при всех t из [0;Т]. При наличии погрешностей полного совпадения не будет. Однако отклонения определяются лишь шумами в различные моменты времени. При этом в качестве оценки периодической составляющей x(t) естественно взять среднее арифметическое yср(t) функций y1(t), y2(t), y3(t), ... (могут быть использованы и другие виды средних величин).
Если же Т отличается от истинного периода Т0 (и кратных ему величин), то различия функций y1(t), y2(t), y3(t), ... между собой определяются также и различием значений x(t) в точках, отстоящих друг от друга на интервалы, длина которых кратна Т.
В предположении отсутствия погрешностей (т.е. когда e(t) тождественно равно 0) рассмотрим поведение функции yср(t) на отрезке [0;Т] при росте длины интервала А наблюдения сигнала, а потому и при росте числа периодов - целой части числа А/Т. Если Т = Т0 или Т кратно Т0, то, как уже сказано, yср(t) совпадает с периодической составляющей x(t). Если число Т/Т0 иррационально, то можно показать, что значения t+mT(modТ0), где m - натуральные числа такие, что t+mT<A, асимптотически (при росте A) равномерно заполняют отрезок [0;Т0], а потому при выполнении соответствующих условий регулярности, например, непрерывности периодической составляющей сигнала, функция yср(t) приближается к константе - среднему значению периодического сигнала x(t), т.е. интегралу от x(t) по отрезку [0;Т0], деленному на Т0. При этом при конечных А функция yср(t) отлична от константы. (Здесь запись t+mT(modТ0) означает теоретико-числовое сравнение по модулю Т0 , т.е. взятие дробной части от числа (t+mT)/Т0 , что соответствует вычитанию соответствующего количества целых п. периодов Т0 .)
Если же число Т/Т0 рационально, то наблюдаем промежуточный случай по сравнению с двумя описанными выше, в котором yср(t), как можно показать, приближается к периодической функции с периодом Т=Т0/n при некотором натуральном n. Эта функция получена усреднением n последовательных участков длины Т0/n периодического сигнала x(t). Она не является константой, хотя разброс ее значений меньше, чем для исходного периодического сигнала, поскольку Т0 - минимальная длина периода.
Из сказанного вытекает, что для оценивания Т целесообразно ввести два показателя: показатель разброса F(T;Y)=F(T; y1(t), y2(t), y3(t), ... ) множества функций {y1(t), y2(t), y3(t), ... } на отрезке [0;Т] и показатель размаха G(T;Y)=G(T, yср(t)) функции yср(t) на отрезке [0;Т]. (Символ Y означает здесь, что показатели разброса и размаха строятся по функции y(t).) При этом показатель разброса нацелен на оценку различий в значениях семейства функций при одном и том же значении аргумента, а показатель размаха - на различие значений одной и той же функции при различных значениях аргумента. Ниже выписан ряд формул для этих показателей в случае непрерывного времени. Для дискретного времени их можно адаптировать двумя способами: либо заменив sup на max, а интеграл на сумму; либо расширив область определения используемых функций на весь отрезок, например, соединив соседние точки отрезками или использовав для заполнения пропусков сплайны более высокого порядка.
В качестве оценки длины периода по фиксированным показателям разброса F(T;Y) и размаха G(T;Y) представляется рациональным использовать то Т, при котором отношение F(T;Y)/G(T;Y) впервые (при росте Т начиная с 0) достигает минимума (впервые - поскольку величины, кратные периоду, сами являются периодами). Поскольку показатели разброса F(T;Y) и размаха G(T;Y) могут быть выбраны многими разными способами, можно указанным выше способом построить целое семейство алгоритмов оценивания длины периода, с каждым из которых может быть связано семейство методов оценивания периодической составляющей путем того или иного способа усреднения функций y1(t), y2(t), y3(t), ...
Показатели разброса и размаха. Ввести показатели разброса F(T;Y)=F(T; y1(t), y2(t), y3(t), ... ) можно разными способами. Пусть k=[A/T]. Можно использовать различные функционалы супремумного типа (здесь и далее число слагаемых k не будем указывать в обозначении функционалов). Первым рассмотрим максимальный разброс непосредственно между значениями функций:
Второй функционал супремумного типа будет учитывать не произвольные отклонения, а только отклонения от "средней функции", т.е. иметь вид
Третий функционал показывает, какую зону "заметают" значения функций:
Для применения функционалов интегрального типа целесообразно сделать замену переменной q=t/T и перейти к функциям Yi(q)=yi(t)=yi(qT), i=1,2,...,k, Yср(q)=yср(t)=yср(qT), определенным на отрезке [0;1]. В качестве показателя разброса представляется полезным рассмотреть то или иное отклонение совокупности функций Yi(q), i=1,2,...,k, друг относительно друга. Можно сказать, что эти функции заполняют некую “трубку”, которая тоньше всего при истинном значении периода T, а внутри нее проходит периодическая составляющая X(q)=x(t)=x(qT). Естественно рассмотреть различные функционалы интегрального типа. Например, можно проинтегрировать максимум модулей попарных разностей:
Вместо максимума можно проинтегрировать сумму:
Как и для функционалов супремумного типа, естественно рассмотреть показатели разброса относительно "средней функции":
Следующие четыре функционала, используемые как показатели разброса, аналогичны четырем предыдущим, но включают в себя расчет квадратов:
Список показателей разброса можно существенно расширить. В частности, естественно использовать также расстояния в функциональных пространствах Lp при произвольных p>1, а для оценивания периодической составляющей применять не только среднее арифметическое, но и другие виды средних.
Показатели размаха также можно ввести самыми различными способами. Например, можно рассмотреть такой показатель:
Пусть сделана замена переменной q=t/T и осуществлен переход к функции Yср(q)=yср(t)=yср(qT). Возможными показателями размаха являются:
Введем среднее значение оценки периодической составляющей:
К естественным показателям размаха относятся, например, такие:
Список показателей размаха, как и список показателей разброса, можно значительно расширить. В частности, естественно использовать расстояния в функциональных пространствах Lp при произвольном p>1, а для оценивания периодической составляющей применять не только среднее арифметическое, но и другие виды средних - медиану, среднее геометрическое и др. (см. главу 3). Вопрос о выборе наилучших (в каком-либо смысле) показателей размаха и разброса в настоящем пункте не обсуждается. Некоторые из причин этого отказа от оптимизации системы показателей рассмотрены ниже.
Алгоритмы оценивания. С прикладной точки зрения остается численно минимизировать один или несколько из 66 описанных выше функционалов Fi(T;Y)/Gj(T;Y), i=1,2,...,11, j=1,2,...,6.
Численная минимизация по одному параметру (возможной длине периода) для современных ЭВМ не вызывает проблем, даже если попросту перебирать возможные значения периода с шагом 0,001. По нескольким реальным или смоделированным сигналам можно установить, какой из функционалов позволяет оценить период и периодическую составляющую реально встречающихся сигналов наиболее точно. Возможно и одновременное использование всех или части функционалов, что в соответствии с методологией устойчивости (см. главу 10) позволяет установить чувствительность оценок к выбору метода оценивания, найти интервал их разброса. Проведенные в Институте высоких статистических технологий и эконометрики расчеты по реальным и смоделированным данным о временных рядах показали, что описанные выше алгоритмы позволяют оценивать длину периода и восстанавливать периодическую составляющую временного ряда достаточно точно с практической точки зрения.
В обширной литературе по временным рядам (см., например, монографии [10-25], дающие представление обо всем массиве литературы по этой тематике) проблеме оценивания периода не уделяется большого внимания. Фактически рекомендуют пользоваться либо периодограммой, либо автокорреляционной функцией. С помощью периодограммы (несостоятельной оценки спектральной плотности) можно выделить лишь синусоидальные составляющие, в то время как в кратко рассмотренных выше прикладных задачах периодическая составляющая представляет интерес сама по себе, без разложения на гармоники. Вторая рекомендация более полезна. В качестве оценки периода можно взять наименьшее положительное число, в котором достигается локальный максимум автокорреляционной функции. Эмпирический коэффициент автокорреляции - еще один функционал типа тех, что перечислены выше.
При поверхностном взгляде на проблемы статистического оценивания, как и на иные проблемы прикладной математики, часто возникает желание обсудить “оптимальность” тех или иных процедур. При более глубоком анализе становятся очевидными два обстоятельства. Во-первых, оптимальность имеет быть лишь в рамках той или иной теоретической модели, при отклонениях от которой оптимальность оценки, как правило, пропадает. Например, выборочное среднее арифметическое как оценка математического ожидания случайной величины оптимальна тогда и только тогда, когда распределение результатов наблюдений - гауссово (доказательство этого утверждения приведено в монографии [30]). С другой стороны, для практически любой статистической процедуры можно подобрать свойство оптимальности так, чтобы эта процедура оказалась оптимальной (как подобрать - это уже дело профессионала). Так, например, метод наименьших модулей оптимален, если погрешности имеют распределение Лапласа, а метод наименьших квадратов - когда их распределение гауссово. Поскольку реальные распределения - не Лапласа и не Гаусса, то указанные математические результаты не могут иметь большого практического значения.
Однако представляется полезным получить доказательства состоятельности оценок изучаемых параметров в возможно более широких, например, непараметрических, постановках. Хотя на основе самого факта сходимости нельзя оценить близость оценок к интересующим исследователя параметрам, но получение доказательства состоятельности - первый шаг при изучении скорости сходимости (подробнее об этом см. главу 10).
Состоятельность оценок. Наиболее общий подход к установлению асимптотического поведения решений экстремальных статистических задач развит в статистике объектов нечисловой природы для случая пространств произвольной природы (см. главу 8, а также работу [31]). Согласно этому подходу сначала при фиксированном Т доказывается сходимость (по вероятности) при значений функционала (показателя разброса) к некоторой предельной функции, а затем проверяются условия, обеспечивающие сходимость Argmin допредельного случайного процесса к Argmin этой детерминированной функции.
Свойства алгоритмов приходится изучать в рамках тех или иных вероятностно-статистических моделей. Моделей может быть много. Достаточно вспомнить историю Центральной Предельной Теоремы (ЦПТ) теории вероятностей, которая на протяжении более 200 лет доказывалась во все более и более широких условиях, вплоть до необходимых и достаточных условий Линдеберга-Феллера (после чего начались обобщения на зависимые слагаемые, на суммы случайных элементов гильбертовых пространств и др.). Отметим, что иногда математические модели далеко выходят за пределы, достаточные для обоснования алгоритмов анализа реальных данных. Так, почти всегда распределения реальных величин дискретны и финитны, а потому, в частности, существуют все моменты. Однако условия финитности и дискретности в вероятностно-статистических моделях часто необоснованно ослабляются. В результате возникают проблемы, не имеющие отношения к реальным данным, например, связанные с измеримостью относительно тех или иных сигма-алгебр. Поэтому в настоящем пункте ограничимся наиболее простыми моделями из адекватных реальным постановкам. Считаем, что читатель знаком с основными определениями, относящимися к теории случайных процессов.
Теорема 1. Пусть случайный процесс e(t) имеет нулевое математическое ожидание, является стационарным и эргодическим (т.е. выполнена теорема Биркгофа-Хинчина) с непрерывными траекториями. Тогда при фиксированном Т и имеем
(сходимость по вероятности), где Еср(q)=Yср(q)-Xср(q), т.е. Еср(q) - среднее арифметическое погрешностей e(qT), e(qT+T), e(qT+2T),...
Доказательство теоремы 1 проводится стандартными методами теории стационарных временных рядов (с шагом Т) с использованием известного условия достаточно быстрого убывания элементов матрицы Лорана по мере удаления от ее главной диагонали (т.е. условия, необходимого и достаточного для справедливости теоремы Биркгофа-Хинчина). С помощью теоремы 1 можно найти асимптотику введенных выше показателей разброса и размаха.
Теорема 2. В предположениях теоремы 1 при фиксированном Т и пронормированные показатели разброса Fi(T;Y) для наблюдаемого сигнала У сближаются по распределению с соответствующими положительными случайными величинами , зависящими от Т, характеристик случайного процесса e(t) и периодической составляющей Х, т.е. существуют числовые последовательности si(k) такие, что
Доказательство теоремы 2 проводится с помощью достаточно трудоемких (в частности, из-за числа функционалов), но стандартных рассуждений (они относятся к теории случайных процессов как части теории вероятностей), посвященных максимумам (не супремумам, т.к. траектории функции x(t) и случайного процесса e(t) непрерывны) случайных процессов и интегралам от них, с использованием принципа инвариантности (см., например, учебное пособие [32]) и ряда результатов теории стационарных случайных процессов (см., например, монографию [19]). Таким образом, пронормированные функционалы разброса асимптотически не зависят от числа слагаемых - в этом и состоит основной смысл теоремы 2.
Теорема 3. В предположениях теоремы 1 при фиксированном Т и показатели размаха для наблюдаемого сигнала У сближаются с соответствующими показателями для периодической составляющей Х, т.е.
Для доказательства используются стандартные оценки, основанные на виде конкретных функционалов, задающих показатели размаха. В отличие от теоремы 2 предельные показатели детерминированы.
Аналоги теорем 2 и 3 верны также и при использовании (в качестве показателей разброса и размаха) расстояний в функциональных пространствах Lp при произвольном p>1, а для оценивания периодической составляющей - не только среднего арифметического, но и других видов средних - медианы, среднего квадратического, среднего геометрического, обобщенных средних по Колмогорову (см. главу 3) и др.
Теорема 4. Пусть выполнены условия теоремы 1, периодическая составляющая непрерывна и имеет период Т0 . Тогда при фиксированном Т и показатели разброса (пронормированные) и размаха стремятся к некоторым детерминированным пределам, зависящим только от Т и Т0 , т.е.
(сходимость по вероятности), минимум каждой из функций Fi(T;Т0), i=1,2,...,11, и максимум каждой из функций Gj(T;Т0) , j=1,2,...,6, достигается при T=Т0 и при T, кратных Т0 , причем у показателей разброса Fi(T;Т0) возможны и иные минимумы, а у показателей размаха Gj(T;Т0) других максимумов нет.
Доказательство вытекает из теорем 2 и 3 и свойств усреднения периодической составляющей при росте длины интервала наблюдения сигнала, описанных в начале настоящего пункта. Отметим, что предельные значения функционала разброса Fi(T;Т0), вообще говоря, показывают разброс случайной погрешности, другими словами, не всегда зависят от периодической составляющей, а потому из-за нормировки на единичный отрезок в ряде случаев оказываются константами. Вместе с тем численные эксперименты показывают, что отмеченная сходимость к пределу является сравнительно медленной, и минимизация непосредственно функционалов разброса (без учета показателей размаха) при конкретной длине сигнала позволяет достаточно точно выделить периодическую составляющую из массива реальных данных. Однако описанные выше теоретические результаты заставили отказаться от первоначальной гипотезы о том, что достаточно использовать только показатели разброса, и привели к необходимости скорректировать алгоритмы, введя деление на показатели размаха.
Теорема 5. В предположениях теоремы 4 оценки, являющиеся первыми локальными минимумами при минимизации по Т отношений одного из 11 перечисленных выше показателей разброса к одному из 6 показателей размаха, являются состоятельными оценками истинного периода Т0, а функция yср(t) является состоятельной оценкой периодической составляющей х(t) на отрезке [0;Т0].
Согласно теоремам 1-4 установлена сходимость (по вероятности) значений допредельных функционалов к предельным при каждом конкретном Т. Для доказательства сходимости минимумов допредельных функционалов к минимумам предельных можно воспользоваться общей теорией асимптотического поведения решения экстремальных статистических задач (см. главу 8 или работу [31]). Условие асимптотической равномерной разбиваемости сформулированное в работе [31], выполнено, как можно показать, в силу непрерывности траекторий случайного процесса (непрерывного сглаживания для временного ряда) и его периодической составляющей, откуда и вытекает заключение теоремы 5, дающей теоретико-статистическое обоснование использованию системы описанных выше эвристических алгоритмов оценивания длины периода и периодической составляющей. При известной или достаточно точно оцененной длине периода сама периодическая составляющая естественным образом оценивается с помощью усреднения перенесенных к началу координат кусков временного ряда, и в силу теоремы 1 эта оценка является состоятельной. Затем для получения оценки математического ожидания сигнала на всей области его определения указанную оценку можно периодически продолжить.
Замечание. При практическом использовании описанных в настоящем пункте алгоритмов целесообразно учитывать дополнительные особенности реальных временных рядов. В частности, обратим внимание на неустойчивость супремумов (в смысле главы 10 настоящей книги) по отношению к выбросам (резко выделяющимся наблюдениям) сравнительно с функционалами интегрального типа. Бывают ситуации, когда методики или аппаратура, регистрирующие значения реальных временных рядов, могут допускать сбои в отдельные моменты времени. Например, если происходит валютный кризис типа "черного вторника", когда курс доллара по отношению к рублю, строго говоря, не определен, другими словами, с точки зрения экономических агентов одновременно существует масса сильно отличающихся курсов. Аналогичная ситуация бывает и в целом ряде других случаев. Набор подходящих ассоциаций вызывают решения руководства страны об обмене денежных знаков, особенно с дискриминационными составляющими. Во всех подобных ситуациях временные ряды дают резкие выбросы (всплески), которые затем, как правило, сглаживаются. Поэтому целесообразно в качестве показателей разброса и размаха использовать функционалы интегрального типа. Вопросам оценивания длины периода и периодической составляющей посвящены многие публикации, в том числе работа [33].
6.4. Метод ЖОК оценки результатов взаимовлияний факторов
Различные субъекты и факторы экономической жизни постоянно влияют друг на друга. Как правило, для каждого из рассматриваемых экономических субъектов (и факторов) можно выделить "непосредственное окружение", которое оказывает на него влияние на него в конкретный момент. Как правило, на него же этот субъект оказывает некоторое обратное влияние. Дальше начинается самое интересное - волны влияний, порожденные разными субъектами, распространяются по всей совокупности, частично усиливают друг друга, частично погашают, порождая в каждый момент времени новые волны.
Разработан компьютерный метод (см. работу [34]), называемый далее ЖОК, предназначенный для оценки результатов влияния описывающих ситуацию факторов на итоговые показатели и друг на друга. Метод ЖОК позволяет получать выводы, полезные для управления различными экономическими структурами на микро- и макроуровнях, от бригад и предприятий до государства в целом. Этот метод использует экономико-математическую модель многомерного временного ряда, в которой коэффициенты непосредственного влияния факторов друг на друга и начальные условия задаются экспертами, т.е. представляет собой синтез экспертных и экономико-математических методов. Опишем основные составляющие этого метода.
Сначала экспертным путем определяется список факторов, которые необходимо учитывать при анализе конкретной ситуации. В качестве примера рассмотрим здесь типовое промышленное предприятие. Для него такими факторами являются, видимо, устойчивость развития, уровень рентабельности, оценка состояния основных и оборотных фондов, положение на рынке, кадровый потенциал, финансовое положение, технологический уровень, технический уровень и качество продукции, степень учета экологических требований, уровень сертификации, научно-технический потенциал и степень его использования, положение в социальной сфере, развитость профсоюзного движения, оценка отношений с конкурентами и властями, и т.д. Основная часть перечисленных факторов носит качественный характер.
Далее определяются необходимые для работы модели начальные уровни факторов, соответствующие современному (т.е. начальному) состоянию изучаемого экономического объекта (проводится оцифровка нечисловых переменных). Они оцениваются экспертами на шкале от (-1) до (+1) с шагом 0,1. В методе ЖОК степень привлечения экспертов может быть различна - от использования одного эксперта, хорошо знающего ситуацию и на основе своих знаний и интуиции указывающего необходимые параметры и связи, до подключения к работе комиссии экспертов, коллективно оценивающих указанные параметры и связи, с использованием той или иной схемы сбора и анализа экспертных мнений (см. главу 12).
Затем экспертами составляется блок-схема непосредственных влияний факторов друг на друга и оценивается степень непосредственных влияний с помощью такой же шкалы от (-1) до (+1) с шагом 0,1. Получается экономико-математическая модель в виде взвешенного ориентированного графа с начальными данными в вершинах. Она несколько напоминает хорошо известную экономистам схему межотраслевого баланса В.Леонтьева, но в отличие от нее использует не только количественные, но - в основном - качественные факторы. Затем просчитываются итерации (опосредованные влияния второго, третьего и т.д. уровней, соответствующие второму, третьему и т.д. моментам времени) вплоть до получения стабильного состояния. Результат работы модели - конечные уровни факторов.
Модель позволяет просчитать развитие экономической структуры при различных сценариях. Обычно одновременно используют три типа сценариев - “Прогноз”, “Поиск” и “Оптимизация”.
Сценарий “Прогноз” показывает результат при отсутствии управляющих воздействий. Он демонстрирует, как будет развиваться ситуация, если в нее не вмешиваться. Исходные данные для сценария “Прогноз” - начальные значения факторов и матрица непосредственных взаимовлияний факторов.
В сценариях типа “Поиск” вводится новое понятие - управляющие факторы. В сценариях этого типа анализируются результаты изменений при наличии тех или иных конкретных воздействий на управляющие факторы. Обычно специалист, работающий с системой ЖОК, имеет целью увеличение значений тех или иных факторов при “удержании” некоторых иных в заданных пределах. В сценариях типа “Поиск” осуществляется эвристический процесс оптимизации, а также анализ поведения системы при тех или иных воздействиях на начальные значения факторов.
В сценариях типа “Оптимизация” кроме списка управляющих факторов задаются целевые факторы и условия на них, которых необходимо добиться. Обычно это - условия выхода на определенные уровни, например, рентабельность должна быть не менее 0.5, а социальная напряженность - не более 0.3. С помощью оптимизационных алгоритмов находится наилучшее управление, позволяющее достигнуть цели или максимально к ней приблизиться. Однако найденные компьютером рекомендации могут включать слишком резкие изменения тех или иных начальных параметров, поэтому результаты расчетов скорее указывают на перспективные варианты изменения управляющих параметров, чем непосредственно задают план действий. С помощью сценариев типа “Поиск” можно на основе этих результатов найти практически реализуемые рекомендации.
Система ЖОК позволяет проследить динамику изменения значений факторов вплоть до их стабилизации, которая обычно наступает через 15-25 итераций (интервалов времени). Такая быстрая сходимость вначале кажется неожиданной. Возможно, сам факт стабилизации является самым важным методологическим выводом из экспериментов с моделью ЖОК: "После первоначальных всплесков замкнутая экономическая система стабилизируется, хотя бы и на весьма низком уровне производства и потребления."
При этом с помощью оцененных экспертами коэффициентов важности факторов (с учетом знака) можно отслеживать общую оценку экономической ситуации.
Система ЖОК является человеко-машинной. Для эффективной работы специалиста желательно, чтобы общее число факторов, используемых в конкретной модели, не превышало 20, а число непосредственных взаимосвязей - 40, хотя эти ограничения несущественны для математического обеспечения компьютерной системы ЖОК. Они существенны для наглядности при построении, обсуждении и совершенствовании модели, для того, чтобы факторы и связи между ними можно было изобразить на листе бумаги или экране компьютера в виде блок-схемы.
Система ЖОК с успехом использовалась для анализа ряда конкретных экономических ситуаций. Так, по заказу Минфина РФ она применялась для анализа взаимовлияний факторов, определяющих динамику налогооблагаемой базы и сбора подоходного налога с физических лиц, налога на имущество, налогов и сборов за пользование природными ресурсами и др. Построенная серия эконометрических моделей обладала некоторыми общими чертами. Прогноз, исходящий из современного экономического положения, во всех случаях указывал на дальнейшее ухудшение ситуации. Активное вмешательство государства в экономику приводило к значительному улучшению показателей, в то время как управление с помощью чисто экономических (монетаристских) методов не позволяло улучшить исходное положение. Полученные результаты подтверждают известную концепцию пяти нобелевских лауреатов по экономике (К.Эрроу, В.Леонтьев и др.), разрабатываемую совместно с Отделением экономики Российской академии наук (Д.С.Львов, С.Ю.Глазьев и др.), о необходимости активного регулирования государством экономических процессов.
Другие примеры применения системы ЖОК касались оптимизации экономической стороны деятельности промышленного предприятия или организации в иной сфере, экономических взаимоотношений отраслей народного хозяйства, а также макроэкономического моделирования, в ходе которого удалось вскрыть две неточности в основной схеме известной монографии К.Р.Макконнелла и С.Л.Брю “Экономикс: Принципы, проблемы и политика” [35], а затем исправить их, включив дополнительные блоки в соответствующую модель.
Эконометрический метод ЖОК может найти широкое применение для анализа экономического состояния и перспектив промышленных предприятий, банков, различных государственных и коммерческих структур.
Подведем итоги главы. Рассмотрены методы анализа и моделирования временных рядов. Они используются прежде всего для прогнозирования экономических явлений и процессов (см. главу 14). Надо отметить, что как самим временным рядам, так и вопросам их прогнозирования посвящена огромная литература. Дополнительно к названным выше монографиям укажем книги [36-42]. Наряду с вероятностно-статистическими методами при прогнозировании активно применяют экспертные методы (см. главу 12).
В настоящей главе рассмотрены лишь основы и отдельные вопросы эконометрики временных рядов - одной из наиболее обширных и сложных (с математико-статистической точки зрения) областей эконометрики. Читатель, желающий глубже познакомиться с этой специфической частью эконометрики, должен обратиться к литературе, в частности, указанной в конце главы.
Цитированная литература
1. Елисеева И.И., Юзбашев М.М. Общая теория статистики. - М.: Финансы и статистика., 1998. - 368 с.
2. Общая теория статистики. Статистическая методология в изучении коммерческой деятельности. / Под ред.А.А. Спирина, О.Э.Башиной. - М,: Финансы и статистика, 1994. - 296 с.
3. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. - М.: Финансы и статистика, 1985. - 488 с.
4. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. - М.: Юнити, 1998. - 1022 с.
5. Доугерти К. Введение в эконометрику. - М.: МГУ, 1999. - 402 с.
6. Катышев П.К., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. - М.: Дело, 1999. - 72 с.
6. Кулинич Е.И. Эконометрия. - М.: Финансы и статистика, 1999. - 302 с.
7. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 1997. - 248 с.
8. Нейлор Т. Машинные имитационные эксперименты с моделями экономических систем. - М.: Мир, 1975. - 500 с.
9. Харин Ю.С., Малюгин В.Н. и др. Основы имитационного и статистического моделирования. - Минск: ДизайнПро, 1997. - 218 с.
10. Андерсон Т. Статистический анализ временных рядов. - М.: Мир, 1976.
11. Бендат Дж., Пирсол А. Измерение и анализ случайных процессов. - М.: Мир, 1974. - 464 с.
12. Бриллинджер Д. Временные ряды. Обработка данных и теория. - М.: Мир, 1980.
13. Венсель В.В. Интегральная регрессия и корреляция: статистическое моделирование рядов динамики. - М.: Финансы и статистика, 1983.
14. Гренандер У. Случайные процессы и статистические выводы. -М.: ИЛ, 1961. - 168 с.
15. Журбенко И.Г. Спектральный анализ временных рядов. - М.: Изд-во Моск. ун-та, 1982.
16. Журбенко И.Г. Анализ стационарных и однородных случайных систем. - М.: Изд-во Моск. ун-та, 1987. 240 с.
17. Кендалл М.Дж., Стъюарт А. Многомерный статистический анализ и временные ряды. - М.: Наука, 1976.
18. Кендэл М. Временные ряды. - М.: Финансы и статистика, 1981.
19. Крамер Г., Лидбеттер М. Стационарные случайные процессы. - М.: Мир, 1969.
20. Ковалева Л.Н. Многофакторное прогнозирование на основе рядов динамики. - М.: Финансы и статистика, 1980.
21. Отнес Р., Эноксон Л. Прикладной анализ временных рядов. - М.: Мир, 1982.
22. Рабинер Р., Гоулд Б. Теория и применение цифровой обработки сигналов. - М.: Мир, 1978.
23. Статистический анализ экономических временных рядов и прогнозирование. (Серия "Ученые записки по статистике", тт.22-23.) - М.: Наука, 1973.
24. Хеннан Э. Многомерные временные ряды. - М.: Мир, 1974.
25. Цветков Э.И. Основы теории статистических измерений. - Л.: Энергоатомиздат, 1986. - 256 с.
26. Петров В.М., Мажуль Л.А. Цикличность социокультурной сферы и проблемы среднесрочного прогнозирования ее развития. // Математическое и компьютерное моделирование в науках о человеке и обществе. Тезисы докладов Всероссийской конференции. - М.: Госуд. ун-т управления, 1999. - С.63-66.
27. Николаев А.В. Структура исторического цикла. // Математическое и компьютерное моделирование в науках о человеке и обществе. Тезисы докладов Всероссийской конференции. - М.: Госуд. ун-т управления, 1999. - С.54-54.
28. Носовский Г.В., Фоменко А.Т. Введение в новую хронологию. (Какой сейчас век?). - М.: КРАФТ+ЛЕАН, 1999.
29. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука, 1979.
30. Каган А.М., Линник Ю.В., Рао С.Р. Характеризационные задачи математической статистики. - М.: Наука, 1972.
31. Орлов А.И. Асимптотика решений экстремальных статистических задач // Анализ нечисловых данных в системных исследованиях. Сб. трудов. Вып.10. - М.: ВНИИСИ, 1982. - С.4-12.
32. Биллингсли П. Сходимость вероятностных мер. - М.: Наука, 1977.
33. Орлов А.И. Метод оценивания длины периода и периодической составляющей сигнала. - В сб.: Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1999. С.38-49.
34. Жихарев В.Н., Кольцов В.Г., Орлов А.И. Новый эконометрический метод "ЖОК" оценки результатов взаимовлияний факторов в инженерном менеджменте . - В сб.: Проблемы технологии, управления и экономики / Под общей редакцией канд. экон. наук. Панкова В.А. Ч.1. Краматорск: Донбасская государственная машиностроительная академия, 1999. - С.87-89.
35. Макконнелл К.Р., Брю С.Л. Экономикс: Принципы, проблемы и политика. В 2 т.: Пер. с англ. 11-го изд. - М.: Республика, 1992.
36. Тейл Г. Эконометрические прогнозы и принятие решений. - М.: Статистика, 1971. - 488 с.
37. Френкель А.А. Математические методы анализа динамики и прогнозирования производительности труда. - М.: Экономика, 1972. - 190 с.
38. Четыркин Е.М. Статистические методы прогнозирования. -М.: Статистика, 1977.
39. Бокс Дж., Дженкинс Г. Анализ временных рядов: Прогноз и управление. - М.: Мир, 1974.
40. Гренджер К., Хатанака М., Спектральный анализ временных рядов в экономике. - - М.: Статистика, 1972.
41. Дженкинс Г., Ваттс Д. Спектральный анализ и его приложения. - М.: Мир, 1971.
42. Маленво Э. Статистические методы в эконометрии. Вып.1,2. - М.: Статистика, 1975, 1976.