Пакеты прикладных программ, используемые для анализа временных рядов Магистрант Факультета Прикладной математики и информатики Васильков Михаил Евгеньевич БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Минск, 2011г.
Введение Решение задач обработки больших массивов данных требует эффективных методов и алгоритмов, реализованных в программных средствах; Задачи обработки временных рядов возникают практически во всех прикладных направления: Экономика и финансы Социология Маркетинговые исследования Экспериментальные исследования в физике, химии, биологии В настоящем обзоре приведены три наиболее популярных пакета прикладных программ для обработки и анализа стат. данных.
Пакеты прикладных программ STATISTICA EViews SPSS Наибольшее распространение получили следующие статистические пакеты прикладных программ:
STATISTICA Statistica пакет для всестороннего статистического анализа, разработанный компанией StatSoft. Алгоритмы математической статистики, реализованные в пакете: o Описательная статистика o Многомерная линейная и нелинейная регрессия; o Дискриминантный и кластерный анализ, деревья классификаций; o Факторный анализ; o Проверка гипотез о виде распределения; o Некоторые алгоритмы непараметрической статистики; o Прогнозирование временных рядов на основе одномерных моделей АРПСС.
Преимущества и недостатки пакета STATISTICA Преимущества пакета STATISTICA: 1.Наибольший из всех изученных пакетов инструментарий визуализации полученных результатов; 2.Наличие руссифицированной версии; 3.В пакете представлена полная реализация алгоритмов статистической классификации; 4.Наличие возможности реализовать и использовать собственные алгоритмы (через написание макросов). 5.Алгоритмы интеллектуального анализа данных (Data Mining) Недостатки пакета STATISTICA: Применение пакета требует высокой теоретической подготовки в ТВиМС. Отсутствие реализации некоторых важных тестов временных рядов (в частности – тестов на стационарность)
EViews Эконометрический пакет Eviews обеспечивает особо сложный и тонкий инструментарий обработки данных, позволяет выполнять регрессионный анализ, строить прогнозы в Windows- ориентированной компьютерной среде. В EViews представлен широкий спектр моделей и методов эконометрического анализа: - методы: ARCH, Binary, Censored, Count, GMM, LS, NLS, Ordered, TSLS, ML - модели: LRM, GRM, ARIMA, Logit, Probit, Tobit, VAR, ECM, VECM, Pooled model
Преимущества и недостатки пакета EViews Преимущества пакета EVews : 1.Компактность: программа содержит меньшее количество модулей; 2.Наиболее полный из всех стат. пакетов набор алгоритмов анализа временных рядов (тесты на стационарность, в т.ч. расширенный тест Дики-Фулера, тест Хаусмана) 3.Возможность исследования панельных данных. 4.Возможность анализа финансовых временных рядов на основе моделей условной гетероскедастичности. Недостатки пакета EViews: Фактически отсутствует возможность реализации собственных алгоритмов По сравнению с пакетом STATISTICA – более слабые возможности визуализации Отсутствие руссифицированной версии
SPSS SPSS Statistics (Statistical Package for the Social Sciences) компьютерная программа для статистической обработки данных, предназначенная для проведения прикладных исследований в первую очередь социальных науках. По сравнению с ранее приведенными пакетами, обладает существенно меньшим инструментарием статистического анализа данных.
Преимущества и недостатки пакета SPSS Преимущества пакета SPSS : 1.Имеются русифицированные версии пакета. 2.Позволяет параллельно обрабатывать несколько подвыборок. 3.Простота в освоении. 4.Имеются специфические методы, нацеленные исключительно на маркетинговые и социологические исследования (например, Conjoint analysis ). Удобен при обработке результатов опроса. 5.Имеется модуль для автоматизации процесса разработки анкеты и ввода результатов опросов ( Data Entry ). Недостатки пакета SPSS : Отсутствует возможность реализации собственных алгоритмов; Существенно уступает в глубине анализа данных.
Заключение Каждый из приведенных пакетов имеет свои недостатки и преимущества. Все они обусловлены отраслевой специализацией каждого из пакетов: 1.STATISTICA: прикладные исследования, требующие обработки экспериментальных данных; 2.EViews: экономика; 3.SPSS: социология, маркетинговые исследования. Выбор пакета должен быть обусловлен спецификой решаемой Вами задачи.
Список использованных источников Харин, Ю.С., Малюгин В.И., Абрамович М.С., Математические и компьютерные основы статистического анализа данных и моделирования/ Ю.С. Харин. Минск.: БГУ, с. Боровиков, В.П., Ивченко Г.И., Прогнозирование в системе STATISTICA в среде WINDOWS/ В.П. Боровиков. Москва: «Финансы и статистика», с.