Как рассчитать дисперсию в Excel: полное руководство с примерами

Дисперсия — это статистический показатель, который помогает оценить разброс данных относительно среднего значения. В Microsoft Excel её можно вычислить несколькими способами, но многие пользователи путают функции для генеральной совокупности и выборочной совокупности, что приводит к ошибкам в анализах. Если вы работаете с финансовыми отчётами, научными исследованиями или просто хотите проанализировать вариативность данных — понимание дисперсии критично.

В этой статье мы разберём не только базовые функции вроде ДИСП и ДИСПР, но и нюансы их применения. Вы узнаете, как избежать типичных ошибок при расчётах, визуализировать результаты с помощью графиков и даже автоматизировать процесс для больших массивов данных. А если вы никогда не сталкивались с статистикой — не переживайте: мы начнём с основ.

⚠️ Внимание: Дисперсия чувствительна к выбросам в данных. Один аномально большой или маленький показатель может исказить результат на 20-30%. Перед расчётами всегда проверяйте массив на аномалии с помощью функции =КВАРТИЛЬ() или инструмента "Условное форматирование".

Что такое дисперсия и зачем её считать в Excel

Дисперсия (от англ. variance) показывает, насколько значения в наборе данных отклоняются от среднего арифметического. Чем больше дисперсия, тем сильнее разброс данных. Этот показатель широко используется в:

  • 📊 Финансовом анализе — для оценки рисков инвестиционных портфелей (чем выше дисперсия доходности актива, тем он рискованнее).
  • 🔬 Научных исследованиях — чтобы подтвердить стабильность экспериментальных данных.
  • 🏭 Контроле качества — для мониторинга отклонений в производственных процессах.
  • 📈 Маркетинге — при сегментации аудитории по поведенческим признакам.

В Excel дисперсия рассчитывается по формуле:

σ² = Σ(xi — μ)² / N (для генеральной совокупности) или s² = Σ(xi — x̄)² / (n-1) (для выборки), где:

  • xi — отдельное значение;
  • μ (мю) или — среднее арифметическое;
  • N/n — количество элементов (с поправкой на выборку).

⚠️ Внимание: Если вы анализируете всю совокупность данных (например, продажи компании за год), используйте функцию для генеральной совокупности. Если работаете с выборкой (опрос 100 клиентов из 10 000), берите функцию для выборочной совокупности — она даёт несмещённую оценку.

📊 Для чего вам нужна дисперсия в Excel?
Финансовый анализ
Научная работа
Контроль качества
Учёба/обучение
Другое

Функции Excel для расчёта дисперсии: разница между ДИСП и ДИСПР

В Excel есть 4 основные функции для расчёта дисперсии, и их часто путают. Разберём каждую:

Функция Описание Формула Пример
ДИСП.Г()
(VAR.P)
Дисперсия генеральной совокупности (все данные) =ДИСП.Г(диапазон) =ДИСП.Г(A2:A10)
ДИСП.В()
(VAR.S)
Дисперсия выборочной совокупности (часть данных) =ДИСП.В(диапазон) =ДИСП.В(B2:B20)
ДИСП()
(VAR)
Устаревшая функция для выборки (аналог ДИСП.В) =ДИСП(диапазон) =ДИСП(C2:C15)
ДИСПР()
(VARP)
Устаревшая функция для генеральной совокупности (аналог ДИСП.Г) =ДИСПР(диапазон) =ДИСПР(D2:D10)

Ключевое отличие: функции для выборки (ДИСП.В, ДИСП) делят сумму квадратов отклонений на n-1, а для генеральной совокупности (ДИСП.Г, ДИСПР) — на n. Это называется поправкой Бесселя и нужно для несмещённой оценки.

🔹 Пример: Если у вас данные о росте всех сотрудников компании (100 человек), используйте ДИСП.Г. Если вы измерили рост у 20 случайных сотрудников, чтобы оценить разброс по всей компании — берите ДИСП.В.

Пошаговая инструкция: как посчитать дисперсию в Excel

Рассмотрим расчёт на примере данных о продажах магазина за 10 дней (в ячейках A2:A11):


День │ Продажи (тыс. руб.)

──────┼───────────────────

1 │ 120

2 │ 150

3 │ 90

4 │ 180

5 │ 200

6 │ 110

7 │ 130

8 │ 160

9 │ 140

10 │ 170

Шаг 1. Выделите ячейку для результата (например, B2).

Шаг 2. Введите формулу в зависимости от типа данных:

  • 📌 Для генеральной совокупности (все дни месяца): =ДИСП.Г(A2:A11).
  • 📌 Для выборки (например, 10 дней из 30): =ДИСП.В(A2:A11).

Шаг 3. Нажмите Enter. Результат — дисперсия в квадратах единиц измерения (в нашем случае — тыс. руб.²).

🔹 Что делать дальше? Чтобы получить стандартное отклонение (в тех же единицах, что и исходные данные), извлеките квадратный корень из дисперсии:

=КОРЕНЬ(ДИСП.В(A2:A11))

☑️ Проверка перед расчётом дисперсии

Выполнено: 0 / 4

Типичные ошибки при расчёте дисперсии и как их избежать

Даже опытные пользователи Excel допускают ошибки при работе с дисперсией. Вот самые распространённые:

  1. Путают генеральную и выборочную совокупность.

    Ошибка: Используют ДИСП.Г для данных опроса 100 клиентов из 10 000.

    Решение: Для выборок всегда берите ДИСП.В — она даёт более точную оценку.

  2. Не учитывают текстовые или пустые ячейки.

    Ошибка: В диапазоне есть ячейка с текстом "Н/Д" — функция вернёт ошибку #ЗНАЧ!.

    Решение: Используйте =ЕСЛИОШИБКА(ДИСП.В(A2:A20); "Ошибка в данных").

  3. Игнорируют единицы измерения.

    Ошибка: Получают дисперсию в "рублях²" и сравнивают её со средним в "рублях".

    Решение: Для интерпретации используйте стандартное отклонение (корень из дисперсии).

⚠️ Внимание: Если ваша дисперсия получилась отрицательной — это 100% ошибка в данных. Дисперсия всегда неотрицательна, так как основана на квадратах отклонений. Проверьте формулы на наличие минусов перед функцией или ошибок в диапазонах.

Почему дисперсия может быть равна нулю?

Дисперсия равна нулю только если все значения в наборе данных одинаковые. Например, для массива [5, 5, 5, 5] среднее равно 5, отклонения от среднего равны 0, а значит и дисперсия = 0. В реальных данных это маловероятно и обычно говорит об ошибке (например, скопированные данные или округление).

Визуализация дисперсии: как построить график в Excel

Числовое значение дисперсии не всегда наглядно. Чтобы лучше понять разброс данных, постройте:

  1. Гистограмму — покажет распределение значений.

    Выделите данные → Вставка → Гистограмма → выберите тип "С группировкой".

  2. Ящик с усами (Box Plot) — визуализирует квартиль, медиану и выбросы.

    В Excel 2016+: Вставка → Диаграмма → Ящик с усами.

  3. Линию тренда — если данные временные (например, продажи по дням).

    Постройте точечную диаграмму и добавьте линию тренда через Добавить элемент диаграммы.

Критическая деталь: При построении гистограммы Excel по умолчанию выбирает ширину столбцов автоматически. Для корректного анализа дисперсии установите фиксированный размер интервала (например, 10 единиц) через Формат оси → Параметры оси → Размер интервала.

📊 Пример: Для данных о продажах (из предыдущего раздела) гистограмма покажет, что большинство значений сконцентрировано вокруг 140-160 тыс. руб., а дисперсия в 1200 отражает разброс в обе стороны.

Продвинутые методы: дисперсия по условию и динамические расчёты

Если вам нужно рассчитать дисперсию только для части данных, соответствующей определённому критерию, используйте:

1. Формулу массива с ЕСЛИ:

=ДИСП.В(ЕСЛИ(A2:A11>120; A2:A11))

🔹 Примечание: После ввода нажмите Ctrl+Shift+Enter (в старых версиях Excel). В новых версиях формула работает как обычная.

2. Функцию ФИЛЬТР (Excel 365 и 2021):

=ДИСП.В(ФИЛЬТР(A2:A11; A2:A11>120))

3. Сводные таблицы:

  • Создайте сводную таблицу по вашим данным.
  • Добавьте поле со значениями в область "Значения".
  • Нажмите на стрелку рядом с полем → Параметры полей значений → Дополнительные вычисления → Дисперсия.

🔹 Пример: Рассчитаем дисперсию продаж только для дней, когда выручка превышала 120 тыс. руб.:

=ДИСП.В(ЕСЛИ(A2:A11>120; A2:A11; ""))

Сравнение дисперсии с другими показателями вариативности

Дисперсия — не единственный способ измерить разброс данных. Вот как она соотносится с другими метриками:

Показатель Формула в Excel Когда использовать Единицы измерения
Дисперсия ДИСП.Г() / ДИСП.В() Для математических расчётов (например, в формулах вероятности) Квадрат исходных единиц
Стандартное отклонение СТАНДОТКЛОН.Г() / СТАНДОТКЛОН.В() Для интерпретации разброса (в тех же единицах, что и данные) Исходные единицы
Размах =МАКС() - МИН() Для быстрой оценки амплитуды колебаний Исходные единицы
Коэффициент вариации =СТАНДОТКЛОН.В()/СРЗНАЧ() Для сравнения разброса данных с разными средними Проценты (%)

🔹 Практический совет: Если вам нужно сравнить вариативность двух наборов данных с разными средними (например, продажи в двух магазинах), используйте коэффициент вариации — он нормализует стандартное отклонение относительно среднего.

=СТАНДОТКЛОН.В(A2:A11)/СРЗНАЧ(A2:A11) * 100

FAQ: Частые вопросы о дисперсии в Excel

❓ Почему моя дисперсия сильно отличается от стандартного отклонения?

Потому что стандартное отклонение — это квадратный корень из дисперсии. Например, если дисперсия = 25, то стандартное отклонение = 5. В Excel используйте функции СТАНДОТКЛОН.Г() или СТАНДОТКЛОН.В(), чтобы получить значение в исходных единицах.

❓ Можно ли рассчитать дисперсию для нечисловых данных?

Нет. Дисперсия определена только для количественных данных. Если у вас категориальные переменные (например, цвета или названия), используйте другие методы анализа, например, индекс разнообразия Симпсона.

❓ Как посчитать дисперсию по группам (например, по месяцам)?

Используйте сводные таблицы или функцию АГРЕГАТ с параметром 6 (дисперсия для выборки) или 7 (дисперсия для генеральной совокупности). Пример:

=АГРЕГАТ(6; 6; $B$2:$B$100 / ($A$2:$A$100 = "Январь"))

🔹 Примечание: Это формула массива — в старых версиях Excel завершайте её нажатием Ctrl+Shift+Enter.

❓ В чём разница между ДИСП и ДИСПР в старых версиях Excel?

Функция ДИСП() рассчитывает дисперсию для выборки (делит на n-1), а ДИСПР() — для генеральной совокупности (делит на n). В новых версиях их заменили на ДИСП.В() и ДИСП.Г() соответственно, но старые функции сохранены для обратной совместимости.

❓ Как автоматизировать расчёт дисперсии для больших данных?

Для больших массивов (тысячи строк) используйте:

  1. Power Query: Импортируйте данные → добавьте столбец с расчётом дисперсии по группам.
  2. VBA: Напишите макрос, который будет динамически обновлять дисперсию при изменении данных.
  3. Горячие клавиши: Выделите диапазон → Alt+M+U+I (для вставки функции ДИСП.В).