интересно
Предыдущая | Содержание | Следующая

Применение неиерархической кластеризации

Проиллюстрируемнеиерархическийметод,используяданныетабл. 20 I иметодоптимизи-рующего распределения. Исходя из результатов иерархической кластеризации, мы заранее определили, что количество кластеров равно трем (трехкластерное решение). Результаты представлены в табл. 20.4.

Исходные кластерные центры — это значения первых трех объектов. Классификационные кластерные центры — это промежуточные значения центров, используемые для отнесения объекта к определенному кластеру. Каждый объект относят к ближайшему классификационному кластерному иентру. Классификационные центры обновляют до тех пор, пока не достигнут критерия остановки. Конечные кластерные центры представляют средние значения переменных для объектов в конечных кластерах.

В табл. 20.4 также показана кластерная принадлежность объектов и расстояние между каждым объектом и его классификационным центром. Следует отметить, что кластерные принадлежности, приведенные в табл. 20.2 (иерархическая кластеризация) и табл. 20.4 (неиерархическая кластеризация), идентичны (кластер 1 табл. 20.2 является кластером 3 в табл. 20.4, а кластер 3 табл. 20.2 — кластером 1 в табл. 20.4), Расстояния между конечными кластерными центрами указывают, что пары кластеров хорошо разделены. Для каждой переменной, лежащей в основе кластеризации, приведено только описательное значе ние /-статистики для одномерной выборки. Случаи или объекты систематично относят к кластерам, чтобы максимизировать разли чия по переменным, лежащим в основе кластеризации, поэтому полученные значения вероят ностей не следует интерпретировать как испытание нулевой гипотезы об отсутствии различий среди кластеров. Следующий пример о выборе больницы продолжает иллюстрацию неиерар хической кластеризации.