Графический метод - Часть 59

Правильно отобранные в корреляционную модель признаки, как правило, связаны между собой. Наличие таких связей между ними позволяет на основе одного фактора иметь информацию о другом. Существование тесной связи между признаками дает основание для исключения одной из них. Например, если в модель урожайности включены две переменные x ¡и х2, характеризующих денежные затраты на гектар, первая - все виды, вторая - затраты на удобрения. Здесь практически будет лишним при включении в модель признаки x ¡исследовать также и признакх2,поскольку она тесно связана с первой. Идея учета одного признака на основании второй лежит в основе метода главных компонент. Следует отметить, что речь не идет только о двух признаки. В таком случае метод главных компонент малоэффективен. Его используют, как правило, при десятках взаеповьязаних признаков. При этом ставится цель "набрать" определенную часть общей вариации результативного признака минимальным количеством переменных. Последние подбирают до тех пор, пока сумма их дисперсий НЕ достигать заданной доли в дисперсии изучаемого явления (например, 60%, 80%, 90% и т.д.).

Метод главных компонент решает следующие задачи:

1. Возмещение скрытых, объективно существующих закономерностей в изменении явлений.

2. Характеристика изучаемого, числом признаков, значительно меньше взятых, на начальном этапе. Число главных компонент, выделенных в процессе исследования, будет содержать (в компактной форме) больше информации, чем первоначально измеренные признаки.

3. Выявление признаков, наиболее тесно связанных с главным компонентом. Иначе говоря, изучение стохастической связи между ними (связь, при которой с изменением одной переменной меняется закон распределения второй).

4. Прогнозирование уровней изучаемых явлений на основании уравнения регрессии, которое получено по информации главных компонент.

Преимущества такого метода прогнозирования в отличие от классического регрессионного анализа можно объяснить тем, что при последнем в модель пытаются включить максимально возможное количество факторов, которые в экономических явлениях часто характеризуются существенной кореллируемости (мультилинеарнистю).

foto_00015.jpg