Показатели выборки - Часть 3

Мода наиболее представительным значением или значением, которое лучше "Заменяет все значения", если мы вынуждены выбрать одно.

Медиана - это такое значение, для которого сумма абсолютных разностей всех значений меньше суммы разниц для любого другого значения. Например, для совокупности {1, 3, 6, 8, 9} медиана МСИ = 6. Абсолютные различия составляют: | 1-6 | = 5, | 3-6 | = 3, | 6-6 | = 0, | 8-6 | = 2, | 9-6 | = 3. Сумма всех этих разниц 5 +3 +0 +2 +3 = 13 меньше суммы разниц по любому иное значение. Например, для 1 абсолютные разницы | 1-1 | = 0, | 3-1 | = 2, | 6-1 | = 5, | 8-1 | = 7, | 9-1 | = 8, а их сумма 0 +2 +5 +7 +8 = 22. Другие расчеты дадут сходные результаты.

Если выбрать медиану, то достигается минимальное отклонение - при условии, что "отклонения" определяется как сумма абсолютной различия каждого значения от медианной оценки. Если же вместо каждого значения берется среднее, обеспечивается минимальное отклонение - при условии, что "отклонения" определяется как сумма квадратов разностей каждого значения со средним.

Использование мер центральной тенденции в качестве характеристик случайной выборки является условием необходимым, но недостаточным. Показатели описательной статистики, кроме МЦТ, включают еще одну группу показателей - меры изменчивости (ММ).

Меры изменчивости (ММ)

Ограниченность мер центральной тенденции для характеристики совокупностей можно продемонстрировать на примере двух выборок (рис. 2.29), которые имеют различные распределения, однако одинаковые (и это не сложно проверить) МЦТ (значение моды Мо, медианы Мы и среднего X равны 4).

Показатели выборки

Рис. 2.29. Свойства ММ

Однако выборки имеют существенную разницу значений основных ММ: дисперсий * х и стандартных отклонений 8х (см. два последних столбика рис. 2.29). Можно отметить своеобразную "чувствительность" показателей ММ относительно свойств совокупности.

Дисперсия выборки объемом п определяется как:

2(Х-X) 2 + (х2-X) 2 + ... + (Хп-X) 2

^ = -: -, (2.3)

п -1

аб0 * 2 = ^ * ~> ДЕ X - среднее арифметическое выборки. п - 1

Дисперсия выборки * 2х, рассчитанная по этой формуле, является несмещенной оценкой своего генерального параметра а2х благодаря внесению поправки Бесселя п / (п-1), то есть:

foto_00007.jpg