Неиерархический кластерный анализ
Функционал J (At, Xt) по своему содержанию близок критерию K (Xr#) компактности кластера и характеризует своего рода «кучность» распределения объектов в признаковом пространстве. Заметим, что в нашем случае центр At кластера Xt может совпадать с одним из реально имеющихся объектов Ai из совокупности A, или быть так называемым «фантомным» объектом, сконструированным из признаков xj в виде (1… Читать ещё >
Неиерархический кластерный анализ (реферат, курсовая, диплом, контрольная)
В методах неиерархического кластерного анализа число кластеров R считается фиксированным и заданным заранее. В алгоритмах кластеризации часто используется понятие центра At кластера Xt, t=1,…, R, который находится как решение задачи минимизации некоторого функционала от расстояния, например, следующего вида:
J (At, Xt) =.(5).
Функционал J (At, Xt) по своему содержанию близок критерию K (Xr#) компактности кластера и характеризует своего рода «кучность» распределения объектов в признаковом пространстве. Заметим, что в нашем случае центр At кластера Xt может совпадать с одним из реально имеющихся объектов Ai из совокупности A, или быть так называемым «фантомным» объектом, сконструированным из признаков xj в виде (1), но реально отсутствующим в исходной совокупности объектов A.
Обобщенная схема неиерархической кластеризации совокупности объектов A={A1,…, An}, представленных мультимножествами, включает следующие основные этапы.
Шаг 1. Выбрать некоторое начальное разбиение совокупности объектов A на R кластеров A ={X1,…, XR}.
Шаг 2. Распределить все объекты Ai по кластерам Xt (t=1,…, R) в соответствии с некоторым правилом. Например, вычислить расстояния d (Ai, Xt) между каждым объектом Ai и кластерами Xt, и поместить объект Ai в ближайший из кластеров Xr, который определяется условием d (Ai, Xr)= =d (Ai, Xt). Или определить центр At для каждого кластера Xt, решив уравнение (5), и поместить каждый объект Ai в кластер с ближайшим центром As, задаваемый условием d (Ai, As) =d (Ai, At).
Шаг 3. Если после распределения всех объектов Ai по кластерам Xt объекты не изменят своей кластерной принадлежности, заданной первоначальным разбиением, то остановиться и вывести результат. В противоположном случае вернуться к шагу 2.
Результаты классификации объектов можно оценить качеством разбиения, в частности, как решение следующей оптимизационной задачи:
H (Xopt) = min, (6).
где функционал J (Ai, Xt) определяется, например, выражением (5). В общем случае решение задачи (6) неоднозначно, поскольку функционал H (Xopt) качества разбиения является функцией, имеющей много локальных экстремумов. Конечный результат зависит и от первоначального (близко или далеко от оптимального) распределения объектов по классам.