Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 9 лет назад пользователемЯков Яминский
1 Проект : Ассоциативный поиск информации с помощью нейронных сетей. Задача: методы кластеризации данных
2 Основные методы поиска информации в базах данных Язык манипулирования данными SQL Язык манипулирования данными SQL Индексация Индексация Каталоги Каталоги Организация поиска данных с помощью нейронных сетей Кохонена Организация поиска данных с помощью нейронных сетей Кохонена
3 Недостатки существующих методов Сложность и громоздкость Сложность и громоздкость Нечувствительность к контексту Нечувствительность к контексту Значительные требования к ресурсам Значительные требования к ресурсам
4 Метрики, использующиеся для кластеризации множества. Евклидова метрика Евклидова метрика Взвешенная Евклидова Взвешенная Евклидова Где связано с использованием дополнительных исследований Где связано с использованием дополнительных исследований Хеммингова Хеммингова
5 Меры близости между группами Расстояние, измеряемое по принципу «ближнего соседа» Расстояние, измеряемое по принципу «ближнего соседа» Расстояние, измеряемое по принципу «дальнего соседа» Расстояние, измеряемое по принципу «дальнего соседа» Расстояние, измеряемое по «центрам тяжести» групп Расстояние, измеряемое по «центрам тяжести» групп Расстояние, измеряемое по принципу «средней связи» Расстояние, измеряемое по принципу «средней связи» Обобщенное К-расстояние (по Колмогорову) Обобщенное К-расстояние (по Колмогорову)
6 К-средних Ключ работы алгоритма основывается на поиске самого плохого кластера по признаку максимально удаленной точки от геометрического центра. Ключ работы алгоритма основывается на поиске самого плохого кластера по признаку максимально удаленной точки от геометрического центра.
7 Исомад(isodata) Основа работы связана с трафаретным выбором претендентов на расщепление по признаку среднеквадратичного отклонения всех точек относительно центра. Основа работы связана с трафаретным выбором претендентов на расщепление по признаку среднеквадратичного отклонения всех точек относительно центра.
8 К-средних versus исомад высокая скорость работы высокая скорость работы линейный рост кодовой книги (одна итерация – плюс один кластер) линейный рост кодовой книги (одна итерация – плюс один кластер) Низкая точность работы на зашумленных данных Низкая точность работы на зашумленных данных Большое время работы алгоритма Рост книги зависит от размера и свойств исследуемого множества Более высокая точность работы на зашумленных данных
9 Общий вид искусственной нейронной сети Трехслойная сеть Трехслойная сеть
10 Архитектура слоя Кохонена
11 Правило настройки смещений Рекуррентное выражение вычисления значения матрицы весов
12 Архитектура самоорганизующейся карты Кохонена
13 Правило Кохонена настройки смещения изменяются веса всех нейронов изменяются веса всех нейронов
14 Шаблонное множество Построение данных методом «от обратного» Вид множества
15 результат Результат работы алгоритмов
16 шум Для большей схожести с реальными данными, множество искусственно зашумляется
17 Boot Strap Сбор статистики и формирование критериев останова. Чистая вероятность относительная
18 Относительна вероятность, где P - «относительная» вероятность P - «чистая» вероятность D- дисперсия (среднеквадратичное отклонение).
19 Пример на другом множестве
20 Список студентов
21 Вид данных для двух размерностей
22 Этапы обучения сети: 10 эпох
23 Этапы обучения сети: 60 эпох
24 Этапы обучения сети: 100 эпох
25 Графическое представление работы сети по пространству 4 мерных данных
26 Спасибо за внимание!
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.