Анализ данных в деятельности предприятия
Зачем нужен? Восприятие Анализ данных воспринимается как 1.Прихоть руководства; 2.Требование гос.органов, инвесторов, акционеров. отсутствует Реальное понятие, зачем он нужен, отсутствует.
Что такое Анализ данных? Анализ данных Анализ данных – метод изучения процесса и оценки результатов. Ключевые моменты: 1. Изучение процесса (продажи упали); 2.Оценка результатов (продажи упали на 25% по сравнению с прошлым месяцем и на 5% по сравнению с тем же месяцем за прошлый год).
Анализ данных – следствие Анализ должен быть постоянным, цикличным. Анализ – контролирующая функция.
Анализ данных – зачем нужен? Анализ данных Анализ данных - центральное место в системе управления предприятием. Важная роль Важная роль анализа в подготовке информации для планирования и прогнозирования результатов деятельности.
Недооценка роли анализа 1.Анализ данных рассматривается только как обработка информации после ее сбора. Все результаты– «под сукно». Бессмысленная неэффективная работа. 2.Отсутствие оперативности в реагировании на действия рынка. 3.Экономические потери. 4.И т.д…
Анализ данных - процесс
Этапы 1.Поиск; 2.Консолидация; 3.Трансформация; 4.Анализ/моделирование; 5.Интерпретация.
Этапы: Поиск информации Информация 1.Внутренняя (80%); (различные СУБД, учетные системы, личные файлы сотрудников) 2.Внешняя.
Этапы: Консолидация 1.Декодирование; 2.Агрегирование; 3.Обогащение; 4.Очистка; 5.Объединение данных. ETL В основе процедуры консолидации лежит процесс ETL – Extraction, Transformation, Loading (Извлечение, Преобразование, Загрузка).
Этапы: Консолидация. Проблемы 1.«Грязные» данные Дубликаты; Пропуски; Аномалии и пр. 2.Непродуманная стратегия ETL
Этапы: Трансформация Представление данных наиболее удобным образом
Этапы: Анализ/Моделирование
Этапы: Интерпретация На этом этапе делаются Выводы для дальнейшего принятия решений.Важно! Решения принимает человек, а не машина. Машина – «советчик». Советами можно не воспользоваться.
Инструменты анализа
Настольные пакеты Статистические пакеты (SPSS) и настольные Data Mining пакеты ориентированы на профессионалов. Их особенности: 1.Слабая интеграция с источниками данных (ручной ввод данных); 2.Бедные средства очистки, предобработки данных (и частичное их отсутствие); 3.Отсутствие гибких возможностей консолидации информации, например, в хранилище данных; 4.Конвейерная (поточная) обработка новых данных затруднительна или реализуется встроенными языками программирования и требует высокой квалификации; 5.Обработка больших объемов данных затруднена; 6.Богатые возможности в плане алгоритмов Data Mining.
СУБД с набором алгоритмов Data Mining Практически все крупные производители СУБД включают в состав своих продуктов средства для анализа данных, OLAP, а также инструменты для консолидации и создания хранилищ данных. Они как бы «встраиваются» в СУБД. Их особенности: 1.Высокая производительность; 2.Алгоритмы анализа данных по максимуму используют преимущества СУБД; 3.Жесткая привязка всех технологий анализа к одной СУБД; 4.Сложность в создании аналитических решений, поскольку работа с СУБД ориентирована на программистов и администраторов баз данных.
Аналитические платформы Аналитическая платформа Аналитическая платформа - это специализированное программное решение (или набор решений), которое содержит в себе все инструменты для осуществления процесса извлечения закономерностей из "сырых" данных: средства консолидации информации в едином источнике (хранилище данных), извлечение, преобразование, трансформацию данных, алгоритмы Data Mining, средства визуализации распространения результатов среди пользователей, а также возможности "конвейерной" обработки новых данных.
Аналитические платформы. Схема
Золотой софт Количество аналитических платформ растет. В 2006 году был проведен первый всероссийский конкурсе «Золотой софт 2006». Deductor среди победителей номинации « Лучшая аналитическая система »
ABC CONSULTING ABC Consulting – компания, специализирующаяся на оказании консультационных услуг предприятиям различных отраслей в области анализа данных, производственного планирования, бюджетирования, управленческого учета, финансового анализа Web-сайт: Web-сайт разработчика Deductor: