Deductor 5 – эволюция платформы
BaseGroup Labs Причины изменений Deductor изменялся под влиянием требований, возникающих при его применения в реальных проектах. Именно насущные потребности бизнеса, а не интерес к новым методам анализа давали толчок к изменениям. В процессе развития системы в BaseGroup Labs изменялось понимание решаемых задач, что влекло за собой серьезные изменения в архитектуре.
BaseGroup Labs Deductor – ver.1 Самообучающиеся алгоритмы – основа системы. Развитие системы шло по пути реализации большого количества алгоритмов в самостоятельных программах, объединенных в программный пакет. Возможности взаимодействия между программами были слабые. Алгоритмы
BaseGroup Labs Data Mining Deductor – ver.2 Data Mining – объединение различных механизмов, ориентированных на решение 5 классов задач: регрессия, классификация, кластеризация, ассоциация, последовательность. Для решения одного класса задач используются разные методы. Алгоритмы
BaseGroup Labs Knowledge Discovery in Databases Data Mining Алгоритмы Deductor – ver.3 Knowledge Discovery in Databases – включение в систему механизмов очистки и трансформации данных. Перед применением собственно методов анализа необходимо проводить специальную предобработку, позволяющую повысить «качество» исходных данных.
BaseGroup Labs Тиражирование знаний Deductor – ver.4-5 Тиражирование знаний – формализация знаний экспертов в виде сценариев обработки и обеспечение возможности их распространения. Трансформация пакета программ в аналитическую платформу, позволяющую поставить процесс анализа «на поток». Knowledge Discovery in Databases Data Mining Алгоритмы
BaseGroup Labs Поддержка процесса тиражирования Процесс тиражирования знаний требует реализацию следующего: Механизмы сбора и консолидации данных Поддержка сценарного подхода к анализу Широкий набор методов анализа Автоматизированная обработка данных Отделение работы эксперта от конечного пользователя Развитые механизмы интеграции
BaseGroup Labs Сбор и консолидация В процессе анализа приходится использовать данные из разнородных источников. Несмотря на различную природу этих данных, форматы хранения, их физическое расположение доступ к данным должны быть унифицирован. Для этого в Deductor встроена поддержка хранилищ данных: Deductor Warehouse – реляционное хранилище данных (Firebird, MS SQL, Oracle) Virtual Warehouse – эмуляция многомерного хранилища данных, работающее поверх любой реляционной СУБД
BaseGroup Labs Сценарный подход В процессе анализа эксперты на интуитивном уровне используют сценарный подход, т.е. разбивают процесс анализа на последовательность шагов, позволяющих пройти путь от данных к знаниям, поэтому данный подход является наиболее естественным для них. В Deductor результат любой обработки может подаваться на вход следующему. Таким образом строятся сценарии обработки. Обработка Набор данных
BaseGroup Labs Широкий набор методов анализа Обеспечить возможность тиражирования знаний, т.е. «конвейерного» выполнения анализа можно, если все действия выполнялись в рамках единой платформы, что позволяет не только значительно упростить процесс тиражирования знаний, но и снизить стоимость поддержания работоспособности системы. Deductor включает широкий набор алгоритмов для выполнения как элементарных операций, так и построения сложных моделей.
BaseGroup Labs Автоматизация обработки Вне зависимости от сложности обработки конечный пользователь должен иметь возможность работать с системой как с «черным ящиком», подавая на вход данные и автоматически получая результат обработки. В Deductor встроены механизмы, позволяющие автоматически «прогонять» данные через систему. Результаты можно просмотреть при помощи встроенных визуализаторов либо экспортировать в сторонние системы.
BaseGroup Labs Разделение пользователей Суть процесса тиражирования знаний заключается в обеспечении возможности обычным пользователям получить результат, не задумываясь о том, как это сделано. Все сложности подготовки сценариев должны быть от конечных пользователей скрыты. В Deductor для аналитиков предназначена программа Studio, где разрабатываются сценарии обработки, а для конечных пользователей – Viewer, где имеются только возможности просмотра результата.
BaseGroup Labs Интеграция со сторонними системами Эксперт оперирует данными из различных систем, и результаты его работы должны выходить за рамки аналитической программы. Полноценная аналитическая платформа немыслима без развитых средств обмена данными и интеграции. Deductor реализует множество механизмов, обеспечивающих простую интеграцию с любыми системами: поддержка баз данных, файловый обмен, пакетная обработка, OLE-Automation, Deductor Server…
BaseGroup Labs Тиражирование знаний Основное назначение Deductor – тиражирование знаний. Все реализованные в нем инструменты создавались для того, чтобы сделать данный процесс более простым, дешевым и комфортным. Deductor позволяет извлечь из накопленных в компании данных интересную и практически полезную информацию и трансформировать ее в конкурентные преимущества.
BaseGroup Labs BaseGroup Labs – профессиональный поставщик Data Warehouse, OLAP, KDD, Data Mining решений и инструментов. Web-сайт: Образование: edu.basegroup.ruedu.basegroup.ru