Обнаружение разладки временных рядов Ковалевский Артём Павлович кафедра высшей математики 18 марта 2011
Природные, экономические и другие явления описываются последовательностями, называемыми временными рядами. Типичный график временного ряда приведен на рисунке. Для анализа и прогноза явления следует предложить математическую модель временного ряда, которая вынужденно оказывается стохастической, то есть зависящей от случая.
Модель со стационарными возмущениями предполагает, что Здесь – наблюдаемые значения, i = 1,…,n. – элементы стационарной случайной последовательности с нулевым математическим ожиданием. Стационарность означает, что стохастические свойства последовательности не меняются при сдвиге. Функция f предполагается частично неизвестной (например, известной с точностью до одного или нескольких параметров). После оценивания параметров получаем оценку этой функции
Вектор составленный из величин называется вектором остатков модели. В наиболее простой постановке задачи вектор u состоит из независимых случайных величин. Это модель с трендом, и f называется функцией тренда. Кроме того, рассматриваются случаи, когда u имеет корреляционную функцию, убывающую по степенному закону. Это модель фрактального гауссовского шума, полезная для целого ряда приложений и активно изучаемая в последние годы. Разладкой называется ситуация, когда функция тренда скачком меняет свои значения в процессе наблюдений. Например, в модели выборки разладка происходит, если до некоторого момента T было выполнено f(t)=a, а начиная с этого момента f(t)=b.
Для обнаружения разладки будем использовать критерии, основанные на понятии эмпирического моста. Эмпирический мост – это случайная ломаная, построенная по центрированным и нормированным последовательным суммам значений. На приведенном ниже графике видны интервалы роста и падения, однако оказывается, что они объясняются случайными причинами – отклонения от горизонтальной оси слишком малы для того, чтобы означать тенденцию. На самом деле этот график – эмпирический мост, построенный по смоделированной случайной выборке.
Формальное определение эмпирического моста Эмпирический мост Z(t) – ломаная, построенная по точкам
Каждый конкретный рассматриваемый критерий проверки однородности (отсутствия разладки) основывается на функционале от эмпирического моста, то есть способе, с помощью которого траектория процесса преобразуется в число. Теоретическая часть исследования состоит в поиске наилучшего критерия. Для ряда моделей доказано, что наилучший в широком классе критерий основан на максимальном отклонении траектории эмпирического моста от горизонтальной оси. Гипотеза об однородности отвергается, если функционал принимает достаточно большие значения (выше некоторого уровня).
В качестве тем исследований для студентов предлагаются следующие применения методов обнаружения разладки: 1.Разладка в экономических моделях. 2. Анализ однородности текстов. 3. Разладка в моделях погодных явлений. 4. Анализ изображений. Для каждой области применения надо строить несколько моделей, а затем выявлять лучшую из них, то есть наименее подверженную разладке.
Для экономических данных – выявлять интервалы, соответствующие модели линейного тренда, моменты смены параметров тренда, частоту и среднюю длительность интервала между моментами разладки. На приведенном ниже графике, несмотря на внешнюю похожесть на график броуновского движения, математическими методами выявляются моменты разладки в конце 1994 и в начале 2001 годов. Курс евро к доллару в
При анализе текстов – индикаторы появлений служебных слов. Анализ текстов позволяет выявлять разнородные части текста и идентифицировать их источники с помощью поисковой системы. Таким способом можно выявить вклад автора, то есть ту часть текста, которая написана им самим, а не скопирована из произведений других авторов. Ф. М. Достоевский, собрание сочинений
Анализ разладки в моделях погодных явлений позволяет, в частности, исследовать закономерности изменения климата. Здесь строятся трендовые модели, а потом анализируются их остатки на наличие разладки. Так, для приведенных ниже данных есть разладка в конце 2005 года – тенденция повышения мутности воды сменилась на противоположную. Логарифмы мутности воды на водозаборе в Екатеринбурге
При компьютерном анализе размытых фотографий штрих-кодов главная трудность – очертить границы штрих-кода, с которого потом считывается информация. Здесь также помогают методы обнаружения разладки.
Спасибо за внимание!