Графический метод - Часть 64

Для метода кластерного анализа однородность совокупности не является обязательным условием. Более того, сам метод позволяет выявить и описать структурные закономерности, обеспечив формирование однородных классов объектов. Дискретность кластерных моделей в отличие от непрерывных регрессионных моделей, обусловленная усреднением и некоторыми потерями информации, обеспечивает более эвристический характер вычислительных процедур, а также снимает ограничение, связанные с алгебраической формой связи.

Наконец, комплексное использование обоих методов в изучении статистических связей создает условия широкого использования метода корреляционно - регрессионного анализа, обеспечивая условия для адекватного его приложения.

Изложенное выше позволяет сделать вывод о том, что применению метода кластерного анализа должно предшествовать изучение теории и накопленной практики этого использования. На начальных этапах использования этого метода исследователь должен иметь четко представление, какое из двух задач он решает. Ли обычная задача типизации, при котором исследуемую совокупность наблюдений следует разделить на относительно небольшое количество группировок. Тогда выполняется работа, аналогичная получению интервалов статистического группирования при обработке одномерных наблюдений. При этом операция осуществляется так, чтобы элементы одной области группировки находились друг от друга по возможности на расстоянии. Вторая задача может заключаться в том, что исследователь пытается определить естественную расстояние выходных элементов (наблюдений) на четко выраженные кластеры, находящиеся друг от друга на некотором расстоянии, но не разбиваются на такие же отдаленные друг от друга части. Следует помнить, что первая задача (задача типизации) всегда имеет решение, второе - в своей постановке может иметь отрицательный результат, то есть может оказаться, что множество исходных наблюдений не проявляет естественного расположения на кластеры, например, образует один кластер.

Немаловажным этапом кластер - анализа является выбор переменных (признаков). Эта стадия анализа является основой формирования одинаковых пространств, в которых должно проводиться моделирование.

Выбор признаков осуществляется, как правило, в две стадии. В основе первой из них лежит формирование первичной гипотезы о наборе признаков, влияющих на изучаемое явление; в основе второй - уточнение гипотезы по результатам консультаций (опросов) специалистов исследуемой области.

Завершенной считается экономическая постановка задачи при условии ее согласованности с требованиями используемого математического аппарата и возможностями вычислительной техники. После этого приступают к сбору исходной информации.

foto_00035.jpg