Графический метод - Часть 62

Другими словами, величина

зависит от масштаба измерения признаков. Для обеспечения сопоставимости признаков их, как правило, нормируют по среднеквадратичным отклонением (сг). Евклидова расстояние, как и аналогичные ей расстоянии Махаланобиса, расстояние метода потенциальных функций и т.п. приемлема в расчетах с признаками, которые имеют количественное измерение. Для качественных признаков, принимающих только два значения (в и 1), применяют формулу расстояния по Хемминг:

к= 1

где хк; - значение к - й признаки в и - м объекте.

Если признаки классифицируются с произвольным числом градаций, рекомендуется использовать формулу меры близости двух разбиваемойа (Е, д), Которая обладает свойствами геометрической расстоянии:

д)= 2и к * - а * и,

2 г, г= 1

где Ег8 = 1 если объекты х3, х2 находятся в одном классе; Ег8 = 0, если объекты х $, хг находятся в разных классах.

По разбиванию элемента Д расчеты выполняются аналогично (Д,, ч.1: Д, л 0,).

Суть задания кластерного анализа такова: существующую некоторое множество объектов необходимо разделить с помощью определенного правила на ранее нанесенный или на нанесенный количество классов. В символике эти задачи можно сформулировать так: множество реализаций, нанесенных в пространстве х с помощью решаемых функций по в (по критерию сходства), нужно разделить на такое количество и таких элементов алфавита А, чтобы потери информации не превышали причиненного величины К.

Таким образом, задача кластерного анализа сводится к представлению первичной информации в сжатом виде без ее потери. Решением такой задачи (как уже понятно) проходит через классификацию признаков (измерений), которыми характеризуется каждый объект. Но речь идет не о классических принципы классификации (например, комбинационное группировки), а о принципах многомерной классификации. Суть ее сводится к объединению (классификации) объектов не последовательно по отдельным признакам, а одновременно по большой численностью признаков. Такой набор их создает так называемый "признакового пространство". Каждому признаку предоставляется содержательность координаты.

foto_00007.jpg