Кластерный анализ Демьянюк Антон Ромашина Мария Лисяк Марина НИУ ВШЭ, Москва, 2012.

Презентация:



Advertisements
Похожие презентации
Высшая школа экономики, Москва, Кластерный анализ Луппа Александр Зайцева Екатерина Чемакина Анфиса Козырева Екатерина.
Advertisements

КЛАСТЕРНЫЙ АНАЛИЗ. Кластерный анализ – это совокупность методов, позволяющих классифицировать многомерные наблюдения. Термин кластерный анализ, впервые.
Графические способы представления информации Кластеры Автор презентации: Лебедева М. Б.
КЛАСТЕРНЫЙ АНАЛИЗ. Кластерный анализ – это совокупность методов, позволяющих классифицировать многомерные наблюдения. Термин кластерный анализ, впервые.
Линейная модель парной регрессии и корреляции. 2 Корреляция – это статистическая зависимость между случайными величинами, не имеющими строго функционального.
Теория статистики Корреляционно-регрессионный анализ: статистическое моделирование зависимостей Часть 1. 1.
Анализ данных Кластеризация. План лекции Определение кластеризации Применение кластеризации Общий алгоритм кластеризации Типы кластеризации Цели: Дать.
Logit и probit модели Петровская А. Славская Т. Шинов В. Высшая школа экономики, Москва,
ИНФОРМАЦИОННОЙ СИСТЕМЫ КЛАССИФИКАЦИИ УГЛЕДОБЫВАЮЩИХ ПРЕДПРИЯТИЙ ПО РЕЗУЛЬТАТАМ ОЦЕНКИ ФИНАНСОВОГО И ФУНКЦИОНАЛЬНОГО МЕНЕДЖМЕНТА МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ.
Посткризисное управление рисками при инвестировании в недвижимость и девелопмент Апрель 2012.
1 Тема урока : Оптимизационное моделирование. 2 Оптимизация Оптимизация (математика)Оптимизация (математика) нахождение оптимума (максимума или минимума)
ЦЕЛИ ПРЕЗЕНТАЦИИ Сравнительный анализ программных продуктов по аудиту Сравнительный анализ программных продуктов по аудиту Определение целей разработки.
Результаты ЕГЭ 2012 года по обществознанию в Новгородской области.
Инвестиционная стратегия банка на рынке ценных бумаг.
«Создание информационной системы, обеспечивающей разработку типологии субъектов Российской Федерации для целей проведения образовательной политики с учетом.
22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г.22 сентября 2012 г. Лекция 10. Однофакторный дисперсионный анализ Задача дисперсионного.
Виды FMEA-анализа Конструкция изделия ( FMEA-анализ конструкции ) Процесс производства продукции ( FMEA- анализ процесса производства ) Бизнес- процессы.
1 «Ключевое предложение» в рамках программы «Ипотека с государственной поддержкой»
1 Основные технические определения 1 Определение 2 Термин 1 Термин 2 … Определение 1 Термин 3 Термин N Определение N Определение 3 …
ВТБ 24 Основные направления работы по обслуживанию клиентов малого бизнеса в 2008 г., перспективы развития в 2009 г.
Транксрипт:

Кластерный анализ Демьянюк Антон Ромашина Мария Лисяк Марина НИУ ВШЭ, Москва, 2012

Высшая школа экономики, Москва, 2012 Кластерного анализа 2 Термин «кластерный анализ» был введен математиком Р. Трионом в 1939 году; Кластерный анализ -один из методов разбиения выборки на группы по каким-либо критериям. Кластер = тип

Высшая школа экономики, Москва, 2012 Цели 3 Понимание данных; Сжатие данных; Обнаружение новизны.

Высшая школа экономики, Москва, 2012 Преимущества 4 Можно применять в различных ситуациях; Не требует априорных предположений о наборе данных; Не накладывает ограничения на представление исследуемых объектов; Позволяет анализировать показатели различных типов данных; Позволяет сокращать размерность данных, делать ее наглядной.

Высшая школа экономики, Москва, 2012 Задачи 5 Разработка типологии или классификации; Исследование полезных концептуальных схем группирования объектов; Порождение гипотез на основе исследования данных; Проверка гипотез.

Высшая школа экономики, Москва, 2012 Этапы кластерного анализа 6 Отбор выборки для кластеризации; Определение множества переменных, по которым будут оцениваться объекты в выборке; Вычисление значений той или иной меры сходства (или различия) между объектами; Применение метода кластерного анализа для создания групп сходных объектов; Проверка достоверности результатов кластерного решения.

Высшая школа экономики, Москва, 2012 Недостатки 7 Может давать неустойчивые кластеры; Он реализует индуктивный метод исследования от частного к общему; Имеет множество особенностей, связанных с внутренними методами;

Высшая школа экономики, Москва, 2012 Использование кластерного анализа 8 Анализ проектной деятельности Выполнение работ в рамках проекта

Высшая школа экономики, Москва, 2012 Анализ проектной деятельности Анализ портфеля проектов Инвестиционный портфель проектов Портфель реальных проектов Оценка эффективности реализуемых проектов 9

Высшая школа экономики, Москва, 2012 Кластерный анализ 10 КритерийПроект 1……..Проект N Фактор 1ххх ………… Фактор Nххх

Высшая школа экономики, Москва, 2012 Графическое отображение 11 Риск Доходность

Высшая школа экономики, Москва, 2012 Предназначение кластерного анализа Анализ портфеля проектов: Балансировка портфеля Разработка общих процессов управления проектами Оценка эффективности реализуемых проектов Выявление групп сходных проектов, для проведения регрессионного анализа 12

«Орский мясокомбинат» Производство колбасных изделий и деликатесов Производство мясной консервации «Говядина тушеная ГОСТ высший сорт» 70% продаж 80% прибыли Пример. Создание бренда для продукта 13

Данные: исследовательская компания Комкон Сбор: заполнение дневников участниками панели Преимущества: размер выборки, стоимость и скорость Этапы исследования потребителей : Выявление списка эмоциональных и функциональных выгод Разделение потребителей на группы: –Факторный анализ (Выявлено 3 фактора) –Кластерный анализ (на базе 3-х факторов сформированы кластеры методом Варда)Варда Проведение исследования 14

«ищущие качество» «большое содержание мяса в банке» (86,3%) «нет сои» (83,8%) «высокое качество» (79,4%) «по ГОСТу» (77,5%) «ищущие вкус» «вкусная» (100%) «не жирная» (92,6%), «содержит мало желе» (92,6%) «не острая» (85,2%) «ищущие низкую цену» «не дорогая» (100%) «безопасность с точки зрения отравления» (100%) «калорийная» (62,8%) «стеклянная банка» (48,8%) Кластеры 15

«ищущие качество» Частота покупки: средняя Возраст: года Личный доход: от 5 до 15 тыс. рублей «ищущие вкус» Частота покупки: низкая Возраст: лет Личный доход: более 20 тыс. рублей «ищущие низкую цену» Частота покупки: высокая Возраст: старше 55 Личный доход: менее 5 тыс. рублей Итоги исследования 16

Расстояние между кластерами: прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения. Отличие: используются методы дисперсионного анализа. На каждом шаге алгоритма объединяются такие два кластера, которые приводят к минимальному увеличению целевой функции, т.е. внутригрупповой суммы квадратов. Этот метод направлен на объединение близко расположенных кластеров и "стремится" создавать кластеры малого размера. Метод Варда