Корреляционный анализ - Часть 4

Корреляционный анализ

Рис. 2.57. Диаграмма рассеяния признаков

- убедиться, что корреляция нелинейная - сначала результаты тестирования круто растут для лиц в возрасте от 10 до 22 лет, достигают максимального значения, а затем медленно уменьшаются. Качественная картина дает основания для применения количественной меры нелинейности - корреляционное отношение, численное значение которого находится в пределах от 0 до 1:

Корреляционный анализ

лень в и среднего в ; 5Бзагап = s в ■ (П - 1) - общая сумма квадратов;

- рассчитать квадраты разностей s ¡отдельно для каждой возрастной группы (возрастные группы выделены закрашенными строками, результаты расчетов и соответствующих формул показано на рис. 2.58 и 2.59);

- внести в ячейку выражение = (С3-СРЗНАЧ ($ С $ 3: $ С $ 4)) Л2. Аналогичные выражения внести в ячейки (возрастная группа 10 содержит только два значения теста);

Корреляционный анализ

- определить Si для других возрастных групп, где х = 14, 18, 22, 26, 30, 34 и 38;

- в ячейке Б18 рассчитать 88внутр (выражение = СУММ (03:017));

- в ячейке Б19 рассчитать 88шгал (выражение = ДИСП (С3: С17) * (А17-1));

- в ячейке Б20 получить отношение п2ухс (внести выражение = 1-018/019)

- в ячейке Б21 рассчитать коэффициент корреляции Пирсона для всего массива с помощью функции MS Excel = Пирсона (В3: В17; С3: С17). Коэффициент корреляции равен примерно нулю (rxy ~ -0,04), что свидетельствует о (якобы) отсутствие связи между переменными;

- рассчитать коэффициенты корреляции отдельно для частей массива: в ячейке D22 для возраста от 10 до 22, в ячейке D23 для возраста от 26 до 38.

Итак, для возраста от 10 до 22 лет коэффициент корреляции имеет высокое положительное значение (rxy = +0,83), что подтверждает прямую связь, который можно наблюдать на диаграмме. Для возраста от 26 до 38 лет коэффициент корреляции имеет отрицательное значение (^ = -0,69), что интерпретируется как обратная связь. Значение корреляционного отношения "0,67 подтверждает высокий уровень нелинейности связи переменных X Y.

Следует обратить внимание на то, что для коэффициента rfyxcспочатку указывают индекс в, а затем - х, который является мерой прогнозирования Y по X.

foto_00060.jpg