Дисперсия и среднеквадратическое (стандартное) отклонение – самые распространенные статистические механизмы для измерения и описания разброса того или иного распределения. Дисперсия обычно обозначается символом σ2 и отражает, насколько далеко от среднего значения расположены наблюдения в рамках того или иного распределения.
При этом расстояние (разница) между каждым наблюдением и средним значением возводится в квадрат; сумма таких составляющих, возведенных в квадрат, затем делится на количество наблюдений.
Поскольку разница между каждым членом и средним значением возводится в квадрат, формула для вычисления дисперсии присваивает определенный вес наблюдениям, которые расположены вдали от среднего значения (то есть «отщепенцам»), как показано в приведенной ниже таблице роста учащихся.
Средний рост обеих групп учащихся составляет 70 дюймов. Суммы абсолютных отклонений от среднего значения в обеих группах также одинаковы – 14 дюймов. По этому показателю разброса указанные два распределения идентичны.
Однако дисперсия для группы 2 оказалась выше из-за веса, присвоенного в формуле дисперсии значениям, которые расположены особенно далеко от среднего значения (в нашем случае эти значения относятся к Сахару и Нарцисо).
Дисперсия сама по себе редко используется в качестве описательной статистики. В наибольшей степени она полезна для определения среднеквадратического (стандартного) отклонения, которое вычисляется как корень квадратный из дисперсии.
Из книги Чарльза Уилана “Голая статистика. Самая интересная книга о самой скучной науке”.