STATISTICA StatSoft ® Russia Системный подход к анализу данных. Владимир Боровиков Виталий Титов
STATISTICA 2000 Windows 95, 98, NT, 2000 Ready На русском языке Около 30 Mb на винчестере Существует Macintosh-версия Клиент-серверный интерфейс
Структура пакета Таблицы данных Графики Таблицы результатов
Импорт данных Прямое преобразование файлов из большинства популярных форматов: + Excel + Lotus (1-2-3, Symphony) + Quattro Pro + xBase (DBase, FoxPro, Clipper) + Paradox + ASCII
Импорт данных Быстро и просто
Импорт данных Поддержка интерфейса открытых баз данных Microsoft ODBC: + MS Access + MS SQL Server + Oracle + Sybase + IBM DB2/2, DB2/ сотни других популярных СУБД
Удобно Импорт данных
ДанныеСтандартизацияПодмножестваФормат ФильтрацияТекстовые значенияВеса Подготовка данных
STATISTICA включает все методы статистического анализа данных: от классических до самых современных Для удобства анализа методы разделены на модули Анализ данных
Интерактивный анализ Весь анализ в системе проводится с использованием наглядных диалоговых окон, следующих типовым сценариям обработки данных. Ввод ПросмотрВыбор Параметры Результат
Кисть Интерактивный анализ
Программы-мастера Размещение графиков
Программы-мастера SQL-запросы к базам данных
Программы-мастера Программирование на STATISTICA BASIC
Автозаполнение Автоматизация Микро- прокрутка
Автоматизация Поиск лучшей модели
Автоотчет
Графики
3D-вращение и перспектива Работа с графикой
Дальнейшая настройка Работа с графикой
Гибкий интерфейс
7 достоинств системы Знакомый Windows-интерфейс Русский язык Полный набор статистических методов Сотни типов графиков Облегчающие работу программы-мастера Объекты и соответствующие им операции Настройка аналитической среды в соответствии с пожеланиями пользователей
Области применения Экономика, финансы Научные исследования Производство
Разведочный анализ Оценивания типа распределения переменных Оценивание степени зависимости переменных Проверка репрезентативности выборки Выбор оптимального объема данных для анализа Агрегирование единичных наблюдений Сегментация различающихся подгрупп Построение гипотез и моделей для тестирования
Все необходимое для эффектной визуализации Разведочный анализ
На компьютере Pentium 200 Сортировка файла 10,000x10 < 2 с. Корреляционная матрица 50x50 по 1000 набл. (4x. точностью) < 1 с. Матрица диаграмм рассеяния 10 x 10 (с гистограммами по диагонали) построенная по 90,000 пар наблюдений около 5 с Разведочный анализ
Широкий спектр задач Оценка необходимого объема средств, необходимого для нормального функционирования финансового рынка Прогноз ставки рефинансирования для промышленных предприятий Оценка и прогноз валютных поступлений Контроль финансового состояния коммерческих банков Оценка внешней экономической деятельности
Популярные задачи Прогнозирование финансовых рядов Предсказание банкротства Сегментация потребителей услуг Оценивание кредитных рисков Контроль операций с кредитными картами Data Mining - модное течение в анализе данных...
Основные методы Прогнозирование временных рядов Деревья классификации Регрессионный анализ Кластерный анализ Другие методы … Прогнозирование временных рядов
Временные ряды Спектральный анализ (анализ Фурье) Цель: Обнаружение периодических колебаний
Временные ряды Экспоненциальное сглаживание Цель: Прогноз новых значений на основе предыдущих с убыванием весов давних наблюдений
Временные ряды Сезонная декомпозиция Цель: Разложить ряд на составляющую тренда, сезонную компоненту и оставшуюся нерегулярную составляющую ТРЕНД-ЦИКЛ СЕЗОННОСТЬ БЕЛЫЙ ШУМ
Временные ряды АРПСС (ARIMA) модель Бокса-Дженкенса Цель: Построение нелинейной модели поведения ряда, хорошо описывающей процесс.
Временные ряды Анализ распределенных лагов (специальный метод оценки запаздывающей зависимости между рядами) ARIMA с интервенциями (позволяет учитывать воздействие дополнительных переменных) Модель Census II (эмпирически доказавшая свою работоспособность модификация сезонной декомпозиции с поправкой на число рабочих дней и присутствие выбросов)
Основные методы Прогнозирование временных рядов Деревья классификации Регрессионный анализ Кластерный анализ Другие методы … Деревья классификации
Classification Trees (Decision Trees) Цель: Построение бинарного дерева для классификации новых наблюдений на основе накопленного опыта.
Основные методы Прогнозирование временных рядов Деревья классификации Регрессионный анализ Кластерный анализ Другие методы … Регрессионный анализ
Линейная регрессия (с поиском оптимального множества предикторов) Цель: Предсказание зависимой переменной как линейной комбинации независимых.
Регрессионный анализ Нелинейная регрессия Цель: Предсказание зависимой переменной как нелинейной комбинации независимых.
Основные методы Прогнозирование временных рядов Деревья классификации Регрессионный анализ Кластерный анализ Другие методы … Кластерный анализ
Древовидная кластеризация Цель: Построение бинарного дерева объединений объектов и групп с наиболее близкими свойствами.
Кластерный анализ K-средних Цель: Разбиение наблюдаемых объектов на k максимально различающихся групп.
Другие методы... Факторный анализ Дискриминантный анализ Дисперсионный анализ Многомерное шкалирование Моделирование структурными уравнениями Нейронные сети
ПРИМЕР АНАЛИЗА StatSoft ® Russia Сезонная корректировка Боровиков Владимир
Сезонная корректировка Выбираем анализ
Сезонная корректировка Выбираем данные
Для нахождения периодичностей используем спектральный анализ
Сезонная корректировка Период: 12 месяцев
Сезонная корректировка Выбираем модель
Сезонная корректировка Строим прогноз