Проект : Ассоциативный поиск информации с помощью нейронных сетей. Задача: методы кластеризации данных.

Презентация:



Advertisements
Похожие презентации
Лекция 11. Методы и алгоритмы анализа структуры многомерных данных. Кластерный анализ. Кластерный анализ предназначен для разбиения множества объектов.
Advertisements

Выполни
Обратные задачи: теория и практика Лекция 7. Решение обратной задачи с предварительным обучением. Новосибирский Государственный Университет Физический.
Анализ данных Кластеризация. План лекции Иерархические алгоритмы (пример: алгоритм ближайшего соседа) Итеративные алгоритмы (пример: k-means) Плотностные.
АНАЛИЗ ДАННЫХ ТРАФИКА НАУЧНОГО УЧРЕЖДЕНИЯ С ИСПОЛЬЗОВАНИЕМ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ Рыговский И.А. Научный руководитель: д.т.н., проф. Родионов А. С. XII.
Нейронные сети. Моделирование нейронных сетей. Модели нейронов. Выполнил: студент 1 курса магистратуры Сергеева Анастасия Юрьевна группа 418 м Москва -
Анализ предметных взаимосвязей по результатам оценки знаний студентов Научный руководитель: Штейнберг А.М Выполнила: Сухорукова Ольга.
Метод поиска лиц на изображениях по симметрии и лицевым признакам к.т.н. Варламов А.Д
© ElVisti Лекция 2 Общие сведения об информационно-поисковых системах.
10.2 Основные парадигмы нейронных сетей обучения без учителя Самоорганизующиеся карты признаков Кохонена (Self-organized map) Кохонена... Выходные.
КЛАСТЕРНЫЙ АНАЛИЗ. Кластерный анализ – это совокупность методов, позволяющих классифицировать многомерные наблюдения. Термин кластерный анализ, впервые.
Кластеризация данных Александр Котов, гр Николай Красильников, гр
ФАКУЛЬТЕТ ПРИКЛАДНОЙ МАТЕМАТИКИ и ИНФОРМАТИКИ Тарасюк Александр Евгеньевич СИСТЕМА РАСПОЗНАВАНИЯ ЛИЦ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ.
КЛАСТЕРНЫЙ АНАЛИЗ. Кластерный анализ – это совокупность методов, позволяющих классифицировать многомерные наблюдения. Термин кластерный анализ, впервые.
Разработка алгоритмов на базе FRiS-функции Лекция 6.
Технология извлечения знаний из использования Интернет.
XI Национальная конференция по искусственному интеллекту, КИИ - 08 Оптимизация многоэкстремальных функций на основе кластерной модификации на основе кластерной.
Анализ данных Кластеризация. План лекции Определение кластеризации Применение кластеризации Общий алгоритм кластеризации Типы кластеризации Цели: Дать.
10.2 Основные парадигмы нейронных сетей обучения без учителя Самоорганизующиеся карты признаков Кохонена (Self-organized map) Кохонена... Выходные.
© ElVisti Лекция 2 Общие сведения об информационно-поисковых системах Дмитрий Владимирович ЛАНДЭ МЕЖДУНАРОДНЫЙ СОЛОМОНОВ УНИВЕРСИТЕТ.
Транксрипт:

Проект : Ассоциативный поиск информации с помощью нейронных сетей. Задача: методы кластеризации данных

Основные методы поиска информации в базах данных Язык манипулирования данными SQL Язык манипулирования данными SQL Индексация Индексация Каталоги Каталоги Организация поиска данных с помощью нейронных сетей Кохонена Организация поиска данных с помощью нейронных сетей Кохонена

Недостатки существующих методов Сложность и громоздкость Сложность и громоздкость Нечувствительность к контексту Нечувствительность к контексту Значительные требования к ресурсам Значительные требования к ресурсам

Метрики, использующиеся для кластеризации множества. Евклидова метрика Евклидова метрика Взвешенная Евклидова Взвешенная Евклидова Где связано с использованием дополнительных исследований Где связано с использованием дополнительных исследований Хеммингова Хеммингова

Меры близости между группами Расстояние, измеряемое по принципу «ближнего соседа» Расстояние, измеряемое по принципу «ближнего соседа» Расстояние, измеряемое по принципу «дальнего соседа» Расстояние, измеряемое по принципу «дальнего соседа» Расстояние, измеряемое по «центрам тяжести» групп Расстояние, измеряемое по «центрам тяжести» групп Расстояние, измеряемое по принципу «средней связи» Расстояние, измеряемое по принципу «средней связи» Обобщенное К-расстояние (по Колмогорову) Обобщенное К-расстояние (по Колмогорову)

К-средних Ключ работы алгоритма основывается на поиске самого плохого кластера по признаку максимально удаленной точки от геометрического центра. Ключ работы алгоритма основывается на поиске самого плохого кластера по признаку максимально удаленной точки от геометрического центра.

Исомад(isodata) Основа работы связана с трафаретным выбором претендентов на расщепление по признаку среднеквадратичного отклонения всех точек относительно центра. Основа работы связана с трафаретным выбором претендентов на расщепление по признаку среднеквадратичного отклонения всех точек относительно центра.

К-средних versus исомад высокая скорость работы высокая скорость работы линейный рост кодовой книги (одна итерация – плюс один кластер) линейный рост кодовой книги (одна итерация – плюс один кластер) Низкая точность работы на зашумленных данных Низкая точность работы на зашумленных данных Большое время работы алгоритма Рост книги зависит от размера и свойств исследуемого множества Более высокая точность работы на зашумленных данных

Общий вид искусственной нейронной сети Трехслойная сеть Трехслойная сеть

Архитектура слоя Кохонена

Правило настройки смещений Рекуррентное выражение вычисления значения матрицы весов

Архитектура самоорганизующейся карты Кохонена

Правило Кохонена настройки смещения изменяются веса всех нейронов изменяются веса всех нейронов

Шаблонное множество Построение данных методом «от обратного» Вид множества

результат Результат работы алгоритмов

шум Для большей схожести с реальными данными, множество искусственно зашумляется

Boot Strap Сбор статистики и формирование критериев останова. Чистая вероятность относительная

Относительна вероятность, где P - «относительная» вероятность P - «чистая» вероятность D- дисперсия (среднеквадратичное отклонение).

Пример на другом множестве

Список студентов

Вид данных для двух размерностей

Этапы обучения сети: 10 эпох

Этапы обучения сети: 60 эпох

Этапы обучения сети: 100 эпох

Графическое представление работы сети по пространству 4 мерных данных

Спасибо за внимание!