Заказать курсовые, контрольные, рефераты...
Образовательные работы на заказ. Недорого!

Алгоритмы классификации: метод одиночной связи, метод полных связей, метод средней связи, метод Уорда

РефератПомощь в написанииУзнать стоимостьмоей работы

Метод Уорда. Данный метод предполагает, что первоначально каждый кластер состоит из одного объекта. Сначала объединяются два ближайших кластера. Для них определяются средние значения каждого признака и рассчитывается сумма квадратов отклонений: Из всех методов кластерного анализа, указанных ранее, самыми распространенными являются иерархические агломеративные методы. Сущность этих методов… Читать ещё >

Алгоритмы классификации: метод одиночной связи, метод полных связей, метод средней связи, метод Уорда (реферат, курсовая, диплом, контрольная)

Из всех методов кластерного анализа, указанных ранее, самыми распространенными являются иерархические агломеративные методы. Сущность этих методов заключается в том, что на первом шаге каждый объект рассматривается как отдельный кластер.

Различают алгоритмы включения нового объекта в существующий кластер и алгоритмы объединения кластеров. В общем виде алгоритм иерархического кластерного анализа можно представить в виде последовательности процедур:

  • 1. Значения исходных переменных нормируются.
  • 2. Рассчитывается матрица расстояний или матрица мер близости.
  • 3. Находится пара самых близких кластеров. По выбранному алгоритму объединяются эти два кластера.4. Новому кластеру присваивается меньший из номеров объединяемых кластеров.

Пункты 2, 3 и 4 повторяются до тех пор, пока все объекты не будут объединены в один кластер или до достижения заданного «порога» близости.

Для включения нового объекта в существующий кластер применяются следующие алгоритмы:

Метод одиночной связи. На основании матрицы расстояний определяются два наиболее близких объекта, они и образуют первый кластер. Далее выбирается объект, который будет включен в этот кластер. Таким объектом будет тот, который имеет наименьшее расстояние хотя бы с одним из объектов, уже включенных в кластер. На следующем шаге аналогично включается в кластер следующий объект и так далее до образования единственного кластера.

Метод полных связей. Включение нового объекта в кластер происходит только в том случае, если расстояние между объектами не меньше некоторого заданного уровня.

Метод средней связи. Для решения вопроса о включении нового объекта в уже существующий кластер вычисляется среднее значение меры близости, которое затем сравнивается с заданным пороговым уровнем (как в предыдущем методе).

Метод Уорда. Данный метод предполагает, что первоначально каждый кластер состоит из одного объекта. Сначала объединяются два ближайших кластера. Для них определяются средние значения каждого признака и рассчитывается сумма квадратов отклонений:

Показать весь текст
Заполнить форму текущей работой