Анализ предметных взаимосвязей по результатам оценки знаний студентов Научный руководитель: Штейнберг А.М Выполнила: Сухорукова Ольга
Кластеризация Задача кластеризации состоит в разделении исследуемого множества объектов на группы похожих объектов, называемых кластерами. Задача кластеризации состоит в разделении исследуемого множества объектов на группы похожих объектов, называемых кластерами. Для определения похожести объектов вводится мера близости, называемая расстоянием. Существуют разные способы вычисления расстояний: евклидово, манхэттенское, Чебышева и др. Для определения похожести объектов вводится мера близости, называемая расстоянием. Существуют разные способы вычисления расстояний: евклидово, манхэттенское, Чебышева и др. Результаты кластеризации могут быть представлены разными способами. Одним из наиболее популярных является дендрограмма – отображение последовательного процесса кластеризации. Результаты кластеризации могут быть представлены разными способами. Одним из наиболее популярных является дендрограмма – отображение последовательного процесса кластеризации. Базовые методы кластеризации делятся на иерархические и неиерархические. Базовые методы кластеризации делятся на иерархические и неиерархические.
Иерархический кластерный анализ В иерархических методах каждое наблюдение образовывает сначала свой отдельный кластер. На первом шаге два соседних кластера объединяются в один. В результате, вы связываете вместе всё большее и большее число объектов и агрегируете все больше и больше кластеров, состоящих из все сильнее различающихся элементов. В иерархических методах каждое наблюдение образовывает сначала свой отдельный кластер. На первом шаге два соседних кластера объединяются в один. В результате, вы связываете вместе всё большее и большее число объектов и агрегируете все больше и больше кластеров, состоящих из все сильнее различающихся элементов. В методе, который в SPSS установлен по умолчанию (Between-groups linkage (Связь между группами)), расстояние между кластерами является средним значением всех расстояний между всеми возможными парами точек из обоих кластеров. В методе, который в SPSS установлен по умолчанию (Between-groups linkage (Связь между группами)), расстояние между кластерами является средним значением всех расстояний между всеми возможными парами точек из обоих кластеров. Евклидово расстояние. Это наиболее общий тип расстояния. Оно попросту является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом: Евклидово расстояние. Это наиболее общий тип расстояния. Оно попросту является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом: расстояние(x,y) = { i (xi - yi) 2 } 1/2 расстояние(x,y) = { i (xi - yi) 2 } 1/2
Матрица близости: Исходные данные:
Шаги агломерации Полученная дендрограмма