Перспективы развития СУБД
интеллектуальный анализ данных интеллектуальный анализ данных (ИАД), пли data mining это процесс выявления значимых корреляций, образцов и тенденций в больших объемах данных. При работе с большими объемами накапливаемой информации необходимо постоянно оперативно отслеживать динамику рынка, а это практически невозможно без автоматизации аналитической деятельности.
OLAP В бизнес-приложениях наибольший интерес представляет интеграция методов интеллектуального анализа данных с технологией оперативной аналитической обработки данных (On- Line Analytical Processing, OLAP). В основе концепции оперативной аналитической обработки (OLAP) лежит многомерное представление данных. Термин OLAP ввел Кодд (Е. F. Codd) в 1993 году. В своей статье он рассмотрел недостатки реляционной модели, в первую очередь невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений», то есть самым понятным для корпоративных аналитиков способом
Пример Так, измерение Исполнитель может определяться направлением консолидации, состоящим из уровней обобщения «предприятиеподразделение-отдел-- служащий». Измерение Время может даже включать два направления консолидации - «год-квартал-месяц- день» и «неделя-день», В этом случае становится возможным произвольный выбор желаемого уровня детализации информации по каждому из измерений. Операция спуска (drilling down) соответствует движению от высших ступеней консолидации к низшим; напротив, операция подъема (rolling up)означает движение от низших уровней к высшим.
Ненормализованные данные Следующем новым направлением в развитии систем управления базами данных является направление, связанное с отказом от нормализации отношений. Во многом нормализация отношений нарушает естественные иерархические связи Между объектами, которые достаточно распространены в нашем мире. Возможность сохранять их на концептуальном (но не на физическом) уровне позволяет пользователям более естественно отражать семантику предметной области. В настоящий момент уже существует теоретическое обоснование работы с ненормализованными отношениями и практические реализации подобных систем.
объектно- ориентированные базы данных. В объектно-ориентированной парадигме предметная область моделируется как множество классов взаимодействующих объектов. Каждый объект характеризуется набором свойств, которые являются как бы его пассивными характеристиками и набором методов работы с этим объектом. Работать с объектом можно только с использованием его методов. Атрибуты объекта могут принимать определенное множество допустимых значений, набор конкретных значений атрибутов объекта определяет его состояние.
Продолжение Множество объектов с одним и тем же набором атрибутов и методов образует класс объектов. Объект должен принадлежать только одному классу (если не учитывать возможности наследования). Допускается наличие примитивных предопределенных классов, объекты-экземпляры которых не имеют атрибутов: целые, строки и т, д. Класс, объекты которого могут служить значениями атрибута объектов другого класса,называется доменом этого атрибута.
Наследование Одной из наиболее перспективных черт объектно- ориентированной парадигмы является принцип наследования. Допускается порождение нового класса на основе уже существующего класса, и этот процесс называется наследованием. В этом случае новый класс, называемый подклассом существующего класса (суперкласса), наследует все атрибуты и методы суперкласса. В подклассе, кроме того, могут быть определены дополнительные атрибуты и методы.
простое и множественное наследование В первом случае подкласс может определяться только на основе одного суперкласса, во втором случае суперклассов может быть несколько. Если в языке или системе поддерживается единичное наследование классов, набор классов образует древовидную иерархию. При поддержании множественного наследования классы связаны в ориентированный граф с корнем, называемый решеткой классов. Объект подкласса считается принадлежащим любому суперклассу этого класса.
Специфика применения объектно- ориентированного подхода для организации и управления БД потребовала уточненного толкования классических концепций и некоторого их расширения. 1. Возникло направление, которое предполагает возможность хранения объектов внутри реляционной БД, 2. Часть разработчиков придерживается мнения о необходимости полного отказа от реляционной парадигмы и перехода на объектно-ориентированную парадигму.
темпоральные баз данных Следующим направлением развития баз данных является появление так называемых темпоральных баз данных, то есть баз данных, чувствительных ко времени. Фактически БД моделирует состояние объектов предметной области в некоторый текущий момент времени. Однако в ряде прикладных областей необходимо исследовать именно изменение состояний объектов во времени, Если использовать чисто реляционную модель, то требуется строить и хранить дополнительно множество отношений, имеющих одинаковые схемы, отличающиеся временем существования или снятия данных.
Основной тезис темпоральных систем состоит в том, что для любого объекта данных, созданного в момент времени t1 и уничтоженного в момент времени t2, в БД сохраняются (и доступны пользователям) все его состояния во временном интервале [t1, t2).
Дедуктивные базы данных. Еще одним из перспективных направлений развития баз данных является направление, связанное с объединением технологии экспертных систем и баз данных и развитие так называемых дедуктивных баз данных. Эти базы основаны на выявлении новых знаний из баз данных не путем запросов пли аналитической обработки, а путем использования правил вывода и построения цепочек применения этих правил для вывода ответов на запросы, Для этих баз данных существуют языки запросов, отличные от классического SQL. В экспертных системах также знания экспертов хранятся и форме правил, чаще всего используются так называемые продукционные правила типа «если описание ситуации то описание действия».
Экспертные системы Экспертная система это программа для компьютера, которая оперирует со знаниями в определенной предметной области с целью выработки рекомендаций или решения проблем. Технология экспертных систем является одним из направлений новой области исследования, которая получила наименование искусственного интеллекта (Artificial Intelligence AI). Исследования в этой области сконцентрированы на разработке и внедрении компьютерных программ, способных эмулировать (имитировать, воспроизводить) те области деятельности человека, которые требуют мышления, определенного мастерства и накопленного опыта. К ним относятся задачи принятия решений, распознавания образов и понимания человеческого языка.
типовые задачи решаемые экспертными системами извлечение информации из первичных данных (таких как сигналы, поступающие от гидролокатора); диагностика неисправностей (как в технических системах, так и в человеческом организме); структурный анализ сложных объектов (например, химических соединений); выбор конфигурации сложных многокомпонентных систем (например, распределенных компьютерных систем); планирование последовательности выполнения операций, приводящих к заданной цели (например, выполняемых промышленными роботами).
Характеристики экспертных систем Моделирует не столько физическую (или иную) природу определенной проблемной области, сколько механизм мышления человека Система, помимо выполнения вычислительных операций, формирует определенные соображения и выводы, основываясь на тех знаниях, которыми она располагает. Знания в системе представлены, как правило, на некотором специальном языке и хранятся отдельно от собственно программного кода, который и формирует выводы и соображения. Этот компонент программы принято называть базой знаний. Экспертная система должна обладать способностью объяснить, почему предложено именно такое решение, и доказать его обоснованность.
Базовые функции экспертных систем Приобретение знаний Представление знаний Управление процессом поиска решения Разъяснение принятого решения