Графический метод - Часть 63

Оперируя п признакам, мы рассматриваем любые - какой объект как точку в n - мерном пространстве, и задача классификации состоит в выявлении сгущения точек (объектов) в этом признаковом пространстве. Общим для сгущения точек является то, что группы (кластеры) формируются на основании "похожести" (приближение) объектов по большому количеству признаков, т.е. классификация осуществляется одновременно по всему комплексу признаков, характеризующих объект. При этом ни один из признаков такого комплекса не является необходимым (или достаточным) условием принадлежности объекта к данной группе.

Формирование групп объектов, близких по комплексу признаков, более эффективное по сравнению с комбинационным группировкой. Так, для последнего объект, имеющий отклонения от границ группировочных признака (нормы, характерной для данной группы по одному единственному признаку набора), будет исключен из группы. Легко представить ситуацию, когда данный признак используется при первой градации объектов. В этом случае объект может оказаться в группе достаточно удаленной от той, с которой она (признак) должен наибольшее сходство. В комбинационном группировке же группы представляют собой ни что иное как сектора признакового пространства. Осуществляя классификацию по названным группировкой, иногда искусственно разрушаем признакового пространство нанесенными границами интервалов групп, тогда как реально существуют обособленно однородные классы.

Преимущество метода кластерного анализа в том, что его математический аппарат позволяет найти и выделить реально существующее в признаковом пространстве накопления объектов (точек) на основании одновременного группировки по большому количеству признаков.

Кластерный анализ, как и корреляционно - регрессионный, является математическим аппаратом изучения статистических связей. Это метод поиска эмпирических закономерностей, но для более широкого класса связей. Для регрессионного анализа является целый ряд трудно выполняемых условий (требований) его применения. Среди них требования нормальности многомерного распределения, невозможность использования качественных признаков, ограничения, налагаемые на алгебраическую форму связи (метод наименьших квадратов эффективен для линейных уравнений) и др..

foto_00066.jpg