Порядок выполнения кластерного анализа: формулировка проблемы; выбор меры расстояния; выбор метода кластеризации; принятие решения о количестве кластеров; интерпретация и профилирование кластеров; оценка достоверности кластеризации
Первый этап — формулировка проблемы кластеризации путем определения переменных, на базе которых она будет проводиться, Затем выбирается соответствующий способ измерения расстояния. Мера расстояния показывает, насколько объекты, подвергнутые кластеризации, схожи или не схожи между собой. Разработано несколько методов кластеризации, и исследователю необходимо выбрать наиболее подходящий для решения… Читать ещё >
Порядок выполнения кластерного анализа: формулировка проблемы; выбор меры расстояния; выбор метода кластеризации; принятие решения о количестве кластеров; интерпретация и профилирование кластеров; оценка достоверности кластеризации (реферат, курсовая, диплом, контрольная)
Первый этап — формулировка проблемы кластеризации путем определения переменных, на базе которых она будет проводиться, Затем выбирается соответствующий способ измерения расстояния. Мера расстояния показывает, насколько объекты, подвергнутые кластеризации, схожи или не схожи между собой. Разработано несколько методов кластеризации, и исследователю необходимо выбрать наиболее подходящий для решения данной проблемы. Решение, а числе кластеров также принимает исследователь. Сформированные кластеры нужно анализировать с точки зрения переменных, использованных для их получения, а также для профилирования кластеров можно использовать дополнительные явно выраженные переменные. И наконец, исследователь должен оценить достоверность (качество) процесса кластеризации. Возможно, самая важная часть формулирования проблемы кластеризации — это выбор пере менных, на основе которых проводят кластеризацию. Включение даже одной или двух посторон них (не имеющих отношение к группированию) переменных может исказить результаты кластеризации. Задача состоит в том, чтобы выбранный набор переменных смог описать сходство между объектами с точки зрения признаков, имеющих отношение к данной проблеме маркетингового исследования. Переменные следует выбирать, исходя из опыта прошлых исследований, теории или тестируемой гипо Экспериментатор должен обладать интуицией и уметь делать выводы. Выбор способа измерения расстояния или меры сходстваЦель кластеризация — группирование схожих объектов. Поэтому для того чтобы оценить, насколько они похожи или непохожи, необходимо использовать некую единицу измерения. Наиболее распространенный метод заключается в том, чтобы в качестве такой меры использовать расстояния между двумя объектами. Объекты с меньшими расстояниями между собой больше похожи, чем объекты с большими расстояниями. Существует несколько способов вычисления расстояния между двумя объектами. Наиболее часто используемая мера сходства— евклидово расстояние или его квадрат, Евклидово расстояние (геометрическое расстояние в многомерном пространстве) равно квадратному корню из суммы квадратов разностей значений для каждой переменной. Если переменные измерены в различныхединицач, то единица измерения влияет нареше-ние кластеризации. В исследовании, посвященном посещению супермаркетов для покупки товаров, переменные, выражающие отношение к посещению магазина, можно измерить по шкале Лайкерта; патронаж (постоянство в посещении магазина) можно выразить через частоту посещений магазина в месяц и через сумму, потраченную на покупки; лояльность к торговой марке — через процент средств, потраченных на покупку товаров в любимом супермаркете. В этих случаях перед кластеризацией респондентов мы должны нормализовать Данные, изменив шкалу измерения каждой переменной таким образом, чтобы среднее равнялось нулю, а стандартное отклонение — единице.