Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 12 лет назад пользователемgendocs.ru
1 Метод Варда
2 Джо Вард Доктор Д. Вард работал в таких направлениях, как Педагогическая психология Статистика И другие. Он был консультантом ВВС, армии и флота США по применению статистических методов для подбора и оценки персонала, поступающего на службу. Последние годы жизни он посветил волонтерской работе в начальной школе, которая названа в честь него - Dr. Joe Ward Elementary School
3 Метод Варда Метод Варда – это альтернативный подход для проведения кластерного анализа. В основном, вместо использования метрик и мер связей данный метод большее рассматривает проблему с точки зрения дисперсионного анализа. Он подходит скорее для анализа количественных переменных, а не для бинарных переменных.
4 Метод Варда Метод Варда – это альтернативный подход для проведения кластерного анализа. В основном, вместо использования метрик и мер связей данный метод большее рассматривает проблему с точки зрения дисперсионного анализа. Метод Вада подходит скорее для анализа количественных переменных, а не для бинарных переменных.
5 Метод Варда Основываясь на том, что кластеры многомерных наблюдений должны иметь примерно эллиптическую форму, считается, что данные из каждого кластера будут реализованы в многомерное распределение. То есть, если построить p- мерную точечную диаграмму, кластеры будут похожи на эллипс.
6 Метод Варда Пусть X ijk – означает значение k- переменной в j – наблюдении, принадлежащему i – кластеру. При этом для реализации данного метода мы должны определить следующее:
7 Метод Варда Ошибка суммы квадратов: Здесь суммируется все переменные во всех подчастях каждого кластера и сравнивается отдельное наблюдение для каждой переменной со средней этой переменной из кластера. Если ESS имеет малые значения, то данные близки к средним по кластеру, подразумевая, что мы уже имеем кластер, как единицу анализа.
8 Метод Варда Общая сумма квадратов: В данном случае сравнивается отдельные наблюдения в каждой переменной с общей средней по переменной.
9 Метод Варда R-квадрат: Значение интерпретируется, как доля вариации, объясняемая специфической кластеризацией наблюдений.
10 Метод Варда Использование метода Варда начинается с образования n кластеров, куда входит по одному наблюдению. На первом шаге формируется n-1 кластер, где в одном из кластеров объединяется два наблюдения. Вычисляется ошибка сумм квадратов и r- квадрат. На следующем этапе образуется n-2 кластера, при этом в двух из кластерах может оказаться по два наблюдения, а во всех остальных по одному, или в одном кластере 3 наблюдения, а во всех остальных по одному. Таким образом на каждом шаге кластеры или наблюдения комбинируются таким образом, чтобы свести к минимуму ошибки суммы квадратов и максимизировать значение r – квадрат. Реализация алгоритма завершается, когда образуется один большой кластер, куда входят все наблюдения.
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.