Чувашский государственный университет имени И. Н. Ульянова Кафедра прикладной физики и нанотехнологий DATA MINING В НАУЧНЫХ ИССЛЕДОВАНИЯХ В.С. АБРУКОВ, С.В. АБРУКОВ, А.В. СМИРНОВ, Е.В. КАРЛОВИЧ
Постановка задачи работы
Содержание работы Проведение научных исследований с помощью средств Data Mining. Представление результатов научных исследований с помощью средств Data Mining.
Data Mining ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ Искусственные нейронные сети (ИНС) Самоорганизующиеся карты Кохонена Деревья решений и другие средства ИНС играют ведущую роль при создании многофакторных вычислительных моделей экспериментальных данных ИНС - единственно возможные «аппроксиматоры» многомерных экспериментальных функций
Искусственные нейронные сети В основе - теорема Колмогорова – Арнольда, адаптированная применительно к ИНС теоремой Хехт-Нильсена ИНС позволяют использовать разнородные данные (качественные и количественные), «непредставительные» (неполные) выборки, анализировать сильно нелинейные связи. Реальный компьютерный эмулятор ИНС, работает (вычисляет) как обычная компьютерная программа. Разница в том, что создание ИНС основано не на программировании с помощью какого-либо языка, а на использовании процедуры обучения на наборе примеров (таблице примеров, базе данных примеров). ИНС применяются в трех случаях: Когда невозможно аналитическое описание задачи. Когда аналитическое описание возможно, но нет алгоритма его решения. Пример - уравнение Шредингера или дифференциальное уравнение распространения волны горения. Когда аналитическое описание возможно и есть алгоритм ее решения, но нет времени для программной реализации алгоритма.
Пример части биологической нейронной сети
Схема биологического нейрона
Схема искусственного нейрона Искусственный нейрон состоит из входов, синапсов, сумматора, аксона, нелинейного преобразователя (функции активации). Здесь: xi - компоненты входного вектора (входные данные); wi - веса синапса (i = 1..., n); S - результат суммирования; Y – передаточный сигнал нейрона; F - нелинейный преобразователь (функция активации).
Виды искусственных нейронных сетей
Вычислительная модель вольтамперной характеристики (ВАХ) наноплёнок линейно- цепочечного углерода (ЛЦУ) с внедрёнными в них атомами металлов и неметаллов (ЛЦУ АМН) Модели позволяют на основе обобщения закономерностей, содержащихся в экспериментальных данных «мгновенно» вычислять ВАХ ЛЦУ АМН для самых разнообразных вариантов внедрения атомов в ЛЦУ
Схема создания модели Сбор экспериментальных данных по ВАХ различных ЛЦУ- АМН
Структура ИНС Определение соответствующей собранной базе данных структуры ИНС и проведение обучения.
Один из экранов полученной вычислительной модели
Экраны «базы знаний» вольтамперных характеристик (приведена только малая часть информации содержащаяся в базе знаний)
Вычислительная модель эксплуатации солнечной электростанции. Исходные данные
Вычислительная модель эксплуатации солнечной электростанции. Структура ИНС
модель, может мгновенно вычислить и представить в виде графиков несколько десятков, существенно отличающихся друг от друга, случаев эксплуатации солнечной электростанции при различных метеоусловиях и выдать прогноз на оптимальные условия эксплуатации солнечной электростанции. Вычислительная модель эксплуатации солнечной электростанции. Экраны модели
Вычислительная модель эксплуатации солнечной электростанции. Характеристика Модель мгновенно вычисляет и представляет в виде графиков несколько десятков случаев эксплуатации солнечной электростанции при различных метеоусловиях и выдает прогноз на оптимальные условия эксплуатации.
Вычислительная модель горения катализированных топлив. Экран модели
Вычислительная модель образовательного процесса в вузе. Экран модели Подробнее результаты работы по созданию разнообразных многофакторных вычислительных моделей в области создания интеллектуальной системы поддержки принятия решений и управления вузом представлены на сайте
База знаний семейных отношений в России. Подробнее результаты работы по созданию многофакторных вычислительных моделей в области семейных отношений - на сайте
Литература Neural Networks for Instrumentation, Measurement and Related Industrial Applications (2003) (Нейронные сети для измерительных устройств, измерений и промышленных применений). Proceedings of the NATO Advanced Study Institute on Neural Networks for Instrumentation, Measurement, and Related Industrial Applications (9-20 October 2001, Crema, Italy)/ ed. by Sergey Ablameyko, Liviu Goras, Marco Gori and Vincenzo Piuri, IOS Press, Series 3: Computer and Systems Sciences – Vol. 185, Amsterdam.
Заключение. Научные исследования Методы интеллектуального анализа данных - это новый подход к проведению фундаментальных и прикладных научных исследований Его достоинства заключаются в следующем: - возможность создания многофакторных моделей эксперимента - возможность решения как прямых, так и обратных задач - возможность прогнозирования результатов еще не проведенных экспериментов
Заключение. Представление результатов научных исследований Методы интеллектуального анализа данных - это возможность реализации нового подхода к представлению результатов научных исследований в научных журналах и отчетах НИР в виде прилагаемого к статье компьютерного исполняемого модуля многофакторной вычислительной модели экспериментальных данных. Его достоинства в следующем: - возможность представления результатов эксперимента в наиболее полном и компактном виде - возможность для читателя ознакомится со всеми закономерностями, содержащимися в экспериментальных данных, а не только с теми, которые представлены авторами статьи или отчета по НИР - возможность построения читателем своих сценариев анализа экспериментальных данных и проверке качества эксперимента
Заключение. Перспективы. Методы интеллектуального анализа данных - это перспектива нового подхода к задачам обработки экспериментальных данных, которые в некоторых случаях являются обязательными элементами экспериментальных работ и которые могут быть более точно решены с помощью искусственных нейронных сетей. Среди них можно отметить, например, задачу нахождения касательной к экспериментальному графику и координаты точки ее пересечения с осью абсцисс, а также задачи нахождения координат точек пересечения экспериментальных графиков с осью ординат или абсцисс, а также другие задачи нахождения особенностей экспериментальных данных.
Наши контакты Чувашский государственный университет, корп. 1, каф. прикладной физики и нанотехнологий ул. Университетская, 38, комн. 225 Тел доб.3602 Fax: Спасибо за внимание!