" Creating clarity in a world awash in data... " Интеллектуальный анализ данных (Data mining)
Таблица 1. Примеры формулировок задач при использовании методов OLAP и Data Mining OLAP Data Mining Каковы средние показатели травматизма для курящих и некурящих? Встречаются ли точные шаблоны в описаниях людей, подверженных повышенному травматизму? Каковы средние размеры телефонных счетов существующих клиентов в сравнении со счетами бывших клиентов отказавшихся от услуг телефонной компании)? Имеются ли характерные портреты клиентов, которые, по всей вероятности, собираются отказаться от услуг телефонной компании? Какова средняя величина ежедневных покупок по украденной и не украденной кредитной карточке? Существуют ли стереотипные схемы покупок для случаев мошенничества с кредитными карточками?
Рисунок 1. Уровни знаний, извлекаемых из данных
Классы систем Data Mining
Предметно-ориентированные аналитические системы 1. Статистические пакеты 2. Нейронные сети 3. Системы рассуждений на основе аналогичных случаев (case based reasoning CBR)
4. Деревья решений (decision trees) 5. Эволюционное программирование 6. Генетические алгоритмы 7. Алгоритмы ограниченного перебора 8. Системы для визуализации многомерных данных
Методы добычи данных (Data mining)
Литература 1. Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? Tandem Computers Inc., Кречетов Н.. Продукты для интеллектуального анализа данных. Рынок программных средств, 14–15, 1997, c. 32– Boulding K. E. General Systems Theory The Skeleton of Science//Management Science, 2, Гик Дж., ван. Прикладная общая теория систем. М.: Мир, Киселев М., Соломатин Е.. Средства добычи знаний в бизнесе и финансах. Открытые системы, 4, 1997, с. 41– Дюк В.А. Обработка данных на ПК в примерах. СПб: Питер, Шатовская Т.Б., Лесная Н.С., Репка В.Б. Интеллектуальный анализ данных. – Учебн. пособие, Шатовська Т.Б., Лєсна Н.С. Дослідження ймовірнісних процесів з використанням пакетів прикладних програм: Навч.посібник. Частина ІІ.