Расчет асимметрии и эксцесса в Excel: пошаговое руководство с формулами

Асимметрия и эксцесс — это ключевые статистические показатели, которые помогают оценить форму распределения данных. Асимметрия показывает, насколько распределение отклоняется от симметричного (например, нормального), а эксцесс характеризует "островершинность" или "плосковершинность" графика по сравнению с нормальным распределением. В Microsoft Excel эти параметры можно рассчитать как вручную через формулы, так и с помощью встроенных функций — но с важными нюансами, о которых многие забывают.

Почему это важно для анализа? Представьте, что вы изучаете доходы клиентов или время выполнения задач: если распределение имеет выраженную асимметрию (например, большинство значений сконцентрировано слева, а справа — редкие выбросы), среднее арифметическое может вводить в заблуждение. Эксцесс же подскажет, насколько данные "сжаты" вокруг центра или, наоборот, распределены равномерно. В этой статье мы разберём не только как считать эти показатели, но и как правильно интерпретировать результаты — с примерами из реальных задач.

———

Что такое асимметрия и эксцесс: простыми словами

Асимметрия (skewness) измеряет степень отклонения распределения данных от симметричной формы. Если majority значений сосредоточено слева, а "хвост" тянется вправо — это положительная асимметрия (например, распределение доходов, где большинство зарабатывает мало, но есть несколько очень богатых). Отрицательная асимметрия, наоборот, указывает на вытянутый левый "хвост" (например, время выполнения задач, где большинство справляется быстро, но есть редкие задержки).

Эксцесс (kurtosis) оценивает "островершинность" распределения по сравнению с нормальным (гауссовым). Положительный эксцесс означает, что данные более сконцентрированы вокруг среднего (острый пик), а хвосты тяжелее — это типично для финансовых рынков. Отрицательный эксцесс говорит о более плоской и широкой вершине (например, равномерное распределение). Важно: в Excel эксцесс рассчитывается относительно нормального распределения, где его значение равно 0.

  • 📊 Симметричное распределение: асимметрия ≈ 0 (например, рост взрослых людей).
  • 💰 Положительная асимметрия: majority данных слева, хвост справа (доходы, страховые выплаты).
  • Отрицательная асимметрия: хвост слева, majority справа (время безотказной работы техники).
  • 📈 Высокий эксцесс: острый пик, тяжёлые хвосты (цены акций, ошибки измерений).
  • 📉 Низкий эксцесс: плоская вершина (равномерное распределение задач по времени).

———

Встроенные функции Excel для расчета

В Excel есть две специализированные функции для этих показателей:

  • =СКОС(диапазон) — рассчитывает асимметрию (skewness).
  • =ЭКСЦЕСС(диапазон) — вычисляет эксцесс (kurtosis).

Пример использования для данных в столбце A1:A100:

=СКОС(A1:A100)  

=ЭКСЦЕСС(A1:A100)

Однако здесь есть критическая особенность: эти функции возвращают выборочные оценки асимметрии и эксцесса (с поправкой на смещение), а не генеральные. Для больших выборок (n > 100) разница минимальна, но для маленьких данных результаты могут отличаться от "ручных" расчётов по формулам.

📊 Какой версией Excel вы пользуетесь?
Excel 2016 или старше
Excel 2019/2021
Excel 365 (онлайн)
Другая программа (LibreOffice, Google Sheets)

———

Ручной расчет асимметрии: формула и пример

Если вам нужна генеральная асимметрия (без поправок), используйте эту формулу:

\[

\text{Асимметрия} = \frac{n}{(n-1)(n-2)} \sum \left( \frac{x_i - \bar{x}}{s} \right)^3

\]

где:

  • n — количество наблюдений,
  • \(\bar{x}\) — среднее арифметическое,
  • \(s\) — стандартное отклонение,
  • \(x_i\) — отдельные значения.

В Excel это реализуется так:

  1. Посчитайте среднее: =СРЗНАЧ(A1:A100).
  2. Посчитайте стандартное отклонение: =СТАНДОТКЛОН.В(A1:A100).
  3. Для каждого значения x_i вычислите ((x_i - среднее)/станд.откл.)^3.
  4. Суммируйте кубы и умножьте на коэффициент =СЧЁТ(A1:A100)/(СЧЁТ(A1:A100)-1)/(СЧЁТ(A1:A100)-2).

Удалите пустые ячейки из диапазона|Проверьте данные на выбросы (исключите их при необходимости)|Используйте СТАНДОТКЛОН.В для выборки, а не генеральной совокупности|Сравните результат с функцией =СКОС для проверки-->

———

Ручной расчет эксцесса: формула и нюансы

Формула для генерального эксцесса:

\[

\text{Эксцесс} = \frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum \left( \frac{x_i - \bar{x}}{s} \right)^4 - \frac{3(n-1)^2}{(n-2)(n-3)}

\]

В Excel:

  1. Повторите шаги 1–2 из расчёта асимметрии (среднее и стандартное отклонение).
  2. Для каждого x_i посчитайте ((x_i - среднее)/станд.откл.)^4.
  3. Суммируйте четвёртые степени и умножьте на коэффициент =СЧЁТ(A1:A100)*(СЧЁТ(A1:A100)+1)/(СЧЁТ(A1:A100)-1)/(СЧЁТ(A1:A100)-2)/(СЧЁТ(A1:A100)-3).
  4. Вычтите поправку: =3*(СЧЁТ(A1:A100)-1)^2/(СЧЁТ(A1:A100)-2)/(СЧЁТ(A1:A100)-3).
⚠️ Внимание: Если в ваших данных меньше 4 наблюдений, формула эксцесса вернёт ошибку #ДЕЛ/0!, так как знаменатель станет нулевым. В таких случаях используйте функцию =ЭКСЦЕСС без ручных вычислений.

———

Сравнение встроенных функций и ручных расчётов

Встроенные функции =СКОС и =ЭКСЦЕСС возвращают несмещённые оценки для выборки, тогда как ручные формулы дают генеральные показатели. Разница становится заметна на маленьких выборках (n < 30). Например:

Параметр Встроенная функция Ручной расчёт Разница при n=10
Асимметрия =СКОС(A1:A10) Формула с кубами До 20%
Эксцесс =ЭКСЦЕСС(A1:A10) Формула с 4-й степенью До 30%
Асимметрия =СКОС(A1:A100) Формула с кубами < 5%

Для большинства практических задач (n > 50) разница несущественна, но в академических исследованиях или при работе с маленькими выборками лучше указывать, какой метод использовался.

———

Практический пример: анализ распределения продаж

Допустим, у вас есть данные о дневных продажах магазина за месяц (30 значений в столбце B2:B31). Как интерпретировать результаты?

  1. Посчитайте асимметрию: =СКОС(B2:B31). Результат: 1.2.
  2. Посчитайте эксцесс: =ЭКСЦЕСС(B2:B31). Результат: 2.5.

Интерпретация:

  • Асимметрия 1.2 > 0: распределение смещено вправо. Это типично для продаж — большинство дней приносят умеренный доход, но есть несколько дней с рекордными продажами (например, перед праздниками).
  • Эксцесс 2.5 > 0: пик распределения острый, хвосты тяжелее, чем у нормального распределения. Это означает, что экстремально высокие или низкие продажи встречаются чаще, чем ожидалось.
⚠️ Внимание: Если эксцесс близок к 0, но асимметрия высокая, это может указывать на смешанное распределение (например, два разных источника данных были объединены). В таком случае стоит разбить данные на группы и анализировать отдельно.

———

Частые ошибки и как их избежать

1. Игнорирование выбросов: Один выброс может сильно исказить асимметрию. Всегда проверяйте данные на аномалии с помощью =КВАРТИЛЬ.ЭКС или диаграммы размаха.

2. Путаница между выборочными и генеральными показателями: Если вам нужны точные генеральные параметры, используйте ручные формулы. Для выборки — встроенные функции.

3. Неправильная интерпретация эксцесса: Многие думают, что положительный эксцесс всегда означает "острый пик", но на самом деле он говорит о тяжёлых хвостах. Например, распределение Стьюдента с 3 степенями свободы имеет бесконечный эксцесс, хотя его пик ниже, чем у нормального распределения.

4. Использование функций для нечисловых данных: =СКОС и =ЭКСЦЕСС проигнорируют текстовые ячейки, но включат их в подсчёт n, что исказит результат. Очищайте данные от текста заранее.

Почему эксцесс нормального распределения равен 0?

Нормальное распределение служит "эталоном" для эксцесса. Его четвёртый центральный момент равен 3, но в формуле эксцесса вычитается именно 3, чтобы получить 0. Это сделано для удобства сравнения: положительный эксцесс означает "более острый, чем нормальный", отрицательный — "более плоский".

———

FAQ: ответы на частые вопросы

Можно ли рассчитать асимметрию для категориальных данных?

Нет. Асимметрия и эксцесс определяются для количественных данных, где можно вычислить среднее и стандартное отклонение. Для категориальных переменных (например, цвета или бренды) используйте другие методы анализа, например, хи-квадрат.

Почему моя асимметрия равна 0, но график явно несимметричный?

Это возможно, если несимметрия компенсируется в обе стороны. Например, у вас есть выбросы и слева, и справа от центра, которые уравновешивают друг друга. Проверьте график (гистограмму) и рассчитайте асимметрию отдельно для верхних и нижних 10% данных.

Какой эксцесс считается "нормальным" для финансовых данных?

Для доходностей акций типичен эксцесс от 3 до 10 (тяжёлые хвосты). Это связано с редкими, но значительными изменениями цен. Если эксцесс ближе к 0, данные могут быть "обрезаны" (например, убраны экстремальные значения).

Можно ли автоматизировать расчёт для большого количества столбцов?

Да. Используйте ВПР или ИНДЕКС/ПОИСКПОЗ для динамического указания диапазона, либо напишите простую макрос-функцию на VBA:

Function CustomSkew(rng As Range) As Double

CustomSkew = Application.WorksheetFunction.Skew(rng)

End Function

Теперь вы можете использовать =CustomSkew(A1:A100) как обычную функцию.

Что делать, если функции =СКОС и =ЭКСЦЕСС отсутствуют в моей версии Excel?

В Excel 2007 и старше эти функции есть по умолчанию. Если их нет:

  1. Проверьте регион настроек: в русскоязычной версии они называются именно СКОС и ЭКСЦЕСС, а не SKEW и KURT.
  2. Установите надстройку Analysis ToolPak (Файл → Параметры → Надстройки → Управление надстройками Excel → Analysis ToolPak).
  3. Используйте ручные формулы (см. разделы выше).