STATISTICA StatSoft ® Russia Системный подход к анализу данных. Владимир Боровиков Виталий Титов.

Презентация:



Advertisements
Похожие презентации
Определение. Случайная величина имеет нормальное распределение вероятностей с параметрами и 2, если ее плотность распределения задается формулой:
Advertisements

Deductor – принципы работы. BaseGroup Labs Назначение системы Deductor является платформой, ориентированной на решение задач анализа самого широкого спектра:
Deductor – принципы работы. BaseGroup Labs Назначение системы Deductor является платформой, ориентированной на решение задач анализа самого широкого спектра:
Использование ИТ в оценке параметров бинарной выборки БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ Кафедра математического.
Deductor – аналитическая платформа. BaseGroup Labs Назначение системы Deductor 5 является платформой, ориентированной на решение задач анализа любых структурированных.
Прогнозирование в Deductor. BaseGroup Labs Задача прогнозирования Прогнозирование – одна из самых востребованных, но при этом и самых сложных задач анализа.
Пакеты прикладных программ, используемые для анализа временных рядов Магистрант Факультета Прикладной математики и информатики Васильков Михаил Евгеньевич.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Пример работы SEWSS: ПРОЦЕСС ОБРАЩЕНИЯ С ТВЕРДЫМИ БЫТОВЫМИ ОТХОДАМИ НА ТЕРРИТОРИИ ГОРОДА.
Лекция 10 Временные ряды в эконометрических исследованиях.
Понятие эконометрики и эконометрических моделейO Эконометрика это наука, которая на базе статистических данных дает количественную характеристику взаимозависимым.
Восьмая независимая научно-практическая конференция «Разработка ПО 2012» ноября, Москва АНАЛИТИЧЕСКИЙ МОДУЛЬ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ УПРАВЛЕНИЯ.
Проф. д. мед.н. Ледощук Б.А. 1 Классификация статистических методов.
АНАЛИЗ ДАННЫХ НА КОМПЬЮТЕРЕ. Регрессионный анализ.
Временные ряды в эконометрических исследованиях..
1. Краткая характеристика MS Access1. Краткая характеристика MS Access 2. Достоинства и недостатки 3. Типы БД 4. Базы данных и системы управления базами.
ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКИХ МЕТОДОВ В ГЕОЭКОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ.
Динамические ряды Лекция 9. Цель лекции Смысл динамической регрессии Нахождение параметров динамической регрессии Прогнозирование с помощью динамической.
АНАЛИЗ ТРЕНДОВ И ВРЕМЕННЫХ РЯДОВ. Введение Временные ряды отличаются от обычных данных об одном временном срезе в том отношении, что в случае временных.
БД (администрирование) 1 Базы данных (администрирование) Аблов Игорь Васильевич Кафедра информационных технологий.
Транксрипт:

STATISTICA StatSoft ® Russia Системный подход к анализу данных. Владимир Боровиков Виталий Титов

STATISTICA 2000 Windows 95, 98, NT, 2000 Ready На русском языке Около 30 Mb на винчестере Существует Macintosh-версия Клиент-серверный интерфейс

Структура пакета Таблицы данных Графики Таблицы результатов

Импорт данных Прямое преобразование файлов из большинства популярных форматов: + Excel + Lotus (1-2-3, Symphony) + Quattro Pro + xBase (DBase, FoxPro, Clipper) + Paradox + ASCII

Импорт данных Быстро и просто

Импорт данных Поддержка интерфейса открытых баз данных Microsoft ODBC: + MS Access + MS SQL Server + Oracle + Sybase + IBM DB2/2, DB2/ сотни других популярных СУБД

Удобно Импорт данных

ДанныеСтандартизацияПодмножестваФормат ФильтрацияТекстовые значенияВеса Подготовка данных

STATISTICA включает все методы статистического анализа данных: от классических до самых современных Для удобства анализа методы разделены на модули Анализ данных

Интерактивный анализ Весь анализ в системе проводится с использованием наглядных диалоговых окон, следующих типовым сценариям обработки данных. Ввод ПросмотрВыбор Параметры Результат

Кисть Интерактивный анализ

Программы-мастера Размещение графиков

Программы-мастера SQL-запросы к базам данных

Программы-мастера Программирование на STATISTICA BASIC

Автозаполнение Автоматизация Микро- прокрутка

Автоматизация Поиск лучшей модели

Автоотчет

Графики

3D-вращение и перспектива Работа с графикой

Дальнейшая настройка Работа с графикой

Гибкий интерфейс

7 достоинств системы Знакомый Windows-интерфейс Русский язык Полный набор статистических методов Сотни типов графиков Облегчающие работу программы-мастера Объекты и соответствующие им операции Настройка аналитической среды в соответствии с пожеланиями пользователей

Области применения Экономика, финансы Научные исследования Производство

Разведочный анализ Оценивания типа распределения переменных Оценивание степени зависимости переменных Проверка репрезентативности выборки Выбор оптимального объема данных для анализа Агрегирование единичных наблюдений Сегментация различающихся подгрупп Построение гипотез и моделей для тестирования

Все необходимое для эффектной визуализации Разведочный анализ

На компьютере Pentium 200 Сортировка файла 10,000x10 < 2 с. Корреляционная матрица 50x50 по 1000 набл. (4x. точностью) < 1 с. Матрица диаграмм рассеяния 10 x 10 (с гистограммами по диагонали) построенная по 90,000 пар наблюдений около 5 с Разведочный анализ

Широкий спектр задач Оценка необходимого объема средств, необходимого для нормального функционирования финансового рынка Прогноз ставки рефинансирования для промышленных предприятий Оценка и прогноз валютных поступлений Контроль финансового состояния коммерческих банков Оценка внешней экономической деятельности

Популярные задачи Прогнозирование финансовых рядов Предсказание банкротства Сегментация потребителей услуг Оценивание кредитных рисков Контроль операций с кредитными картами Data Mining - модное течение в анализе данных...

Основные методы Прогнозирование временных рядов Деревья классификации Регрессионный анализ Кластерный анализ Другие методы … Прогнозирование временных рядов

Временные ряды Спектральный анализ (анализ Фурье) Цель: Обнаружение периодических колебаний

Временные ряды Экспоненциальное сглаживание Цель: Прогноз новых значений на основе предыдущих с убыванием весов давних наблюдений

Временные ряды Сезонная декомпозиция Цель: Разложить ряд на составляющую тренда, сезонную компоненту и оставшуюся нерегулярную составляющую ТРЕНД-ЦИКЛ СЕЗОННОСТЬ БЕЛЫЙ ШУМ

Временные ряды АРПСС (ARIMA) модель Бокса-Дженкенса Цель: Построение нелинейной модели поведения ряда, хорошо описывающей процесс.

Временные ряды Анализ распределенных лагов (специальный метод оценки запаздывающей зависимости между рядами) ARIMA с интервенциями (позволяет учитывать воздействие дополнительных переменных) Модель Census II (эмпирически доказавшая свою работоспособность модификация сезонной декомпозиции с поправкой на число рабочих дней и присутствие выбросов)

Основные методы Прогнозирование временных рядов Деревья классификации Регрессионный анализ Кластерный анализ Другие методы … Деревья классификации

Classification Trees (Decision Trees) Цель: Построение бинарного дерева для классификации новых наблюдений на основе накопленного опыта.

Основные методы Прогнозирование временных рядов Деревья классификации Регрессионный анализ Кластерный анализ Другие методы … Регрессионный анализ

Линейная регрессия (с поиском оптимального множества предикторов) Цель: Предсказание зависимой переменной как линейной комбинации независимых.

Регрессионный анализ Нелинейная регрессия Цель: Предсказание зависимой переменной как нелинейной комбинации независимых.

Основные методы Прогнозирование временных рядов Деревья классификации Регрессионный анализ Кластерный анализ Другие методы … Кластерный анализ

Древовидная кластеризация Цель: Построение бинарного дерева объединений объектов и групп с наиболее близкими свойствами.

Кластерный анализ K-средних Цель: Разбиение наблюдаемых объектов на k максимально различающихся групп.

Другие методы... Факторный анализ Дискриминантный анализ Дисперсионный анализ Многомерное шкалирование Моделирование структурными уравнениями Нейронные сети

ПРИМЕР АНАЛИЗА StatSoft ® Russia Сезонная корректировка Боровиков Владимир

Сезонная корректировка Выбираем анализ

Сезонная корректировка Выбираем данные

Для нахождения периодичностей используем спектральный анализ

Сезонная корректировка Период: 12 месяцев

Сезонная корректировка Выбираем модель

Сезонная корректировка Строим прогноз