Кластерный анализ Демьянюк Антон Ромашина Мария Лисяк Марина НИУ ВШЭ, Москва, 2012
Высшая школа экономики, Москва, 2012 Кластерного анализа 2 Термин «кластерный анализ» был введен математиком Р. Трионом в 1939 году; Кластерный анализ -один из методов разбиения выборки на группы по каким-либо критериям. Кластер = тип
Высшая школа экономики, Москва, 2012 Цели 3 Понимание данных; Сжатие данных; Обнаружение новизны.
Высшая школа экономики, Москва, 2012 Преимущества 4 Можно применять в различных ситуациях; Не требует априорных предположений о наборе данных; Не накладывает ограничения на представление исследуемых объектов; Позволяет анализировать показатели различных типов данных; Позволяет сокращать размерность данных, делать ее наглядной.
Высшая школа экономики, Москва, 2012 Задачи 5 Разработка типологии или классификации; Исследование полезных концептуальных схем группирования объектов; Порождение гипотез на основе исследования данных; Проверка гипотез.
Высшая школа экономики, Москва, 2012 Этапы кластерного анализа 6 Отбор выборки для кластеризации; Определение множества переменных, по которым будут оцениваться объекты в выборке; Вычисление значений той или иной меры сходства (или различия) между объектами; Применение метода кластерного анализа для создания групп сходных объектов; Проверка достоверности результатов кластерного решения.
Высшая школа экономики, Москва, 2012 Недостатки 7 Может давать неустойчивые кластеры; Он реализует индуктивный метод исследования от частного к общему; Имеет множество особенностей, связанных с внутренними методами;
Высшая школа экономики, Москва, 2012 Использование кластерного анализа 8 Анализ проектной деятельности Выполнение работ в рамках проекта
Высшая школа экономики, Москва, 2012 Анализ проектной деятельности Анализ портфеля проектов Инвестиционный портфель проектов Портфель реальных проектов Оценка эффективности реализуемых проектов 9
Высшая школа экономики, Москва, 2012 Кластерный анализ 10 КритерийПроект 1……..Проект N Фактор 1ххх ………… Фактор Nххх
Высшая школа экономики, Москва, 2012 Графическое отображение 11 Риск Доходность
Высшая школа экономики, Москва, 2012 Предназначение кластерного анализа Анализ портфеля проектов: Балансировка портфеля Разработка общих процессов управления проектами Оценка эффективности реализуемых проектов Выявление групп сходных проектов, для проведения регрессионного анализа 12
«Орский мясокомбинат» Производство колбасных изделий и деликатесов Производство мясной консервации «Говядина тушеная ГОСТ высший сорт» 70% продаж 80% прибыли Пример. Создание бренда для продукта 13
Данные: исследовательская компания Комкон Сбор: заполнение дневников участниками панели Преимущества: размер выборки, стоимость и скорость Этапы исследования потребителей : Выявление списка эмоциональных и функциональных выгод Разделение потребителей на группы: –Факторный анализ (Выявлено 3 фактора) –Кластерный анализ (на базе 3-х факторов сформированы кластеры методом Варда)Варда Проведение исследования 14
«ищущие качество» «большое содержание мяса в банке» (86,3%) «нет сои» (83,8%) «высокое качество» (79,4%) «по ГОСТу» (77,5%) «ищущие вкус» «вкусная» (100%) «не жирная» (92,6%), «содержит мало желе» (92,6%) «не острая» (85,2%) «ищущие низкую цену» «не дорогая» (100%) «безопасность с точки зрения отравления» (100%) «калорийная» (62,8%) «стеклянная банка» (48,8%) Кластеры 15
«ищущие качество» Частота покупки: средняя Возраст: года Личный доход: от 5 до 15 тыс. рублей «ищущие вкус» Частота покупки: низкая Возраст: лет Личный доход: более 20 тыс. рублей «ищущие низкую цену» Частота покупки: высокая Возраст: старше 55 Личный доход: менее 5 тыс. рублей Итоги исследования 16
Расстояние между кластерами: прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения. Отличие: используются методы дисперсионного анализа. На каждом шаге алгоритма объединяются такие два кластера, которые приводят к минимальному увеличению целевой функции, т.е. внутригрупповой суммы квадратов. Этот метод направлен на объединение близко расположенных кластеров и "стремится" создавать кластеры малого размера. Метод Варда