Графический метод - Часть 61

Полученные в результате разграничения группы называются кластерами, а методы их нахождения - кластер-анализом. В кластерном анализе признаки объединяются в один количественный показатель схожести (несхожести) группируя объектов.

Любая мера схожисти представляет собой некоторую функцию, которая ставит в соответствие каждой паре точек (х;, Хи) некоторое ЧИСЛО сиу, характеризующий степень сходства (близости) между объектами И;, практически используется следующие типы мер схожисти: 1) коэффициент сходства) так называемые квантифицированной коэффициенты связи) 2) коэффициенты связи (корреляции), 3) показатели расстояния в метрическом пространстве.

Роль меры сходства играет функция расстояния, введение которой ведет к понятию метрического пространства. Последний представляет собой множество элементов с какой - либо природой явлений. Для какой - либо пары элементов этого множества определено определенное овеществленного число, называется расстоянием. Всего применяемые его показатели в задачах автоматической классификации социально - экономических объектов - это расстояние по Хемминг и евклидово расстояние.

Если представить какую - либо пару элементов Е и Д, а овеществленный для них число Б (Е, К), укажем три свойства расстояния: 1) если Е и Д совпадают, расстояние Б (Е, К) = 0, 2) для любого - либо трех точек Е, Д, С

Б (Е, К) <Б (Е, С) (С, Д), 3) Б (Е, К) = Б (Д, Е,).

Среди известных функций расстояния самая распространенная-евклидово расстояние. Эмпирическая формула ее имеет вид:

Графический метод

где хки-значение к-й признаки в и - м объекте.

Учитывая недостатки евклидовой расстояния, обусловленные невозможностью учесть возможную неравномерность осей пространства, математическая литература рекомендует пользоваться нормированной евклидовой расстоянием. Расчет ее аналогичен расчету величиныа4, но по стандартизированным значениями признаков.

Необходимость такого способа расчета объясняется тем, что возможен случай, когда два объекта весьма схожи по всем признакам и значительно различаются по одной. По этому признаку в евклидовой расстояния они будут далеки друг от друга.

foto_00029.jpg