Обозначение дисперсии в Excel: функции, формулы и практические примеры

Дисперсия — один из ключевых показателей статистики, который характеризует разброс данных относительно среднего значения. В Microsoft Excel её расчёт автоматизирован с помощью специализированных функций, но многие пользователи сталкиваются с путаницей: какие именно формулы использовать, в чём разница между ними и как правильно интерпретировать результаты.

В этой статье мы разберём все способы обозначения дисперсии в Excel, включая функции для выборки и генеральной совокупности, нюансы синтаксиса и типичные ошибки. Вы узнаете, когда применять ДИСП или ДИСП.Г, как учитывать текстовые значения в данных и почему результаты могут отличаться от ручных расчётов. Материал актуален для Excel 2016–2026 (включая Microsoft 365) и подходит как для начинающих, так и для опытных аналитиков.

Что такое дисперсия и зачем она нужна в Excel

Дисперсия (от англ. variance) показывает, насколько значения в наборе данных отклоняются от их среднего арифметического. Чем выше дисперсия, тем сильнее разброс данных. В анализе это помогает:

  • 📊 Оценивать стабильность процессов (например, в производстве или финансах).
  • 🔍 Выявлять аномалии или выбросы в данных.
  • 📈 Строить прогнозные модели (дисперсия используется в регрессионном анализе).
  • 🧪 Проверять гипотезы в научных исследованиях.

В Excel дисперсия рассчитывается по формуле:

Для выборки (оценка дисперсии генеральной совокупности по части данных):

ДИСП(число1; [число2]; ...) = SUM((xi - x̄)²) / (n - 1)

Для генеральной совокупности (все данные доступны):

ДИСП.Г(число1; [число2]; ...) = SUM((xi - x̄)²) / n

Где — среднее значение, n — количество наблюдений.

⚠️ Внимание: Использование неправильной функции (например, ДИСП вместо ДИСП.Г) может занизить или завысить результат на 10–30% в зависимости от объёма данных. Всегда уточняйте, анализируете вы выборку или полную совокупность!

Функции дисперсии в Excel: полный список с описанием

В Excel есть 6 функций для расчёта дисперсии, но только 4 из них актуальны для современных версий программы. Разберём каждую:

Функция Описание Пример Аналог в английской версии
ДИСП(число1; [число2]; ...) Выборочная дисперсия (смещённая оценка, делитель n-1) =ДИСП(A1:A10) VAR.S
ДИСП.В(число1; [число2]; ...) Выборочная дисперсия (устаревшая функция, оставлена для совместимости) =ДИСП.В(A1:A10) VAR
ДИСП.Г(число1; [число2]; ...) Дисперсия генеральной совокупности (делитель n) =ДИСП.Г(A1:A10) VAR.P
ДИСПР(число1; [число2]; ...) Устаревшая функция для генеральной совокупности (аналог ДИСП.Г) =ДИСПР(A1:A10) VARP

Важно: функции ДИСП.В и ДИСПР сохранены для обратной совместимости, но в новых проектах рекомендуется использовать ДИСП и ДИСП.Г.

Разница между выборочной и генеральной дисперсией проявляется при малом количестве данных. Например, для массива {1; 2; 3}:

  • ДИСП вернёт 1 (делитель n-1 = 2).
  • ДИСП.Г вернёт 0.666... (делитель n = 3).
📊 Какую функцию дисперсии вы используете чаще?
ДИСП
ДИСП.Г
ДИСП.В
ДИСПР
Не знаю

Практические примеры расчёта дисперсии

Рассмотрим 3 реальных кейса, где требуется посчитать дисперсию в Excel:

Пример 1: Анализ продаж по дням недели

Допустим, у вас есть данные о продажах за 5 дней: 120, 150, 130, 160, 140. Нужно оценить стабильность продаж (выборочная дисперсия).

=ДИСП(120; 150; 130; 160; 140)  →  Результат: 160

Интерпретация: средний квадрат отклонений от среднего значения (140) составляет 160. Чем меньше это число, тем стабильнее продажи.

Пример 2: Контроль качества на производстве

Вы измерили диаметр 10 деталей (генеральная совокупность): 9.8, 10.1, 9.9, 10.0, 10.2, 9.7, 10.0, 9.9, 10.1, 10.0. Требуется проверить, укладываются ли отклонения в норму (≤ 0.04).

=ДИСП.Г(9.8; 10.1; 9.9; 10.0; 10.2; 9.7; 10.0; 9.9; 10.1; 10.0)  →  Результат: 0.0256

Вывод: дисперсия в пределах нормы (0.0256 < 0.04).

Пример 3: Оценка волатильности акций

У вас есть дневные доходности акции за месяц (20 значений). Чтобы оценить риск, рассчитайте выборочную дисперсию:

=ДИСП(B2:B21)

Совет: для финансового анализа часто используют стандартное отклонение (корень из дисперсии), которое в Excel рассчитывается функцией СТАНДОТКЛОН.

Удалите пустые ячейки в диапазоне|Убедитесь, что данные числовые (нет текста)|Выберите правильную функцию (ДИСП или ДИСП.Г)|Проверьте делитель (n или n-1)-->

Типичные ошибки и как их избежать

Даже опытные пользователи Excel допускают ошибки при расчёте дисперсии. Вот самые распространённые:

  1. Использование текста в данных.

    Если в диапазоне есть ячейка с текстом (например, "Н/Д"), ДИСП вернёт ошибку #ЗНАЧ!. Решение: используйте функцию ЕСЛИОШИБКА или очистите данные:

    =ДИСП(ЕСЛИОШИБКА(A1:A10; ""))
  2. Путаница между выборкой и генеральной совокупностью.

    Если вы анализируете все доступные данные (например, продажи за год), используйте ДИСП.Г. Если это часть данных (например, опрос 100 клиентов из 10 000), берите ДИСП.

  3. Игнорирование скрытых ячеек.

    Функции дисперсии учитывают все ячейки в диапазоне, даже скрытые. Чтобы их исключить, используйте ВЫБОРКА:

    =ДИСП(ЕСЛИ(СТРОКА(A1:A10)-МИН(СТРОКА(A1:A10))+1<=СЧЁТ(A1:A10); A1:A10))
⚠️ Внимание: Если ваш диапазон содержит логические значения (ИСТИНА/ЛОЖЬ), они будут интерпретированы как 1/0. Чтобы исключить их, используйте ЕСЛИ:
=ДИСП(ЕСЛИ(ТИП(A1:A10)=1; A1:A10))

Дисперсия vs стандартное отклонение: когда что использовать

Дисперсия и стандартное отклонение тесно связаны: стандартное отклонение — это квадратный корень из дисперсии. Но их применение отличается:

Показатель Формула в Excel Когда использовать
Дисперсия ДИСП / ДИСП.Г Для математических расчётов (например, в формулах регрессии).
Стандартное отклонение СТАНДОТКЛОН.Г / СТАНДОТКЛОН.В Для интерпретации разброса в реальных единицах (например, "отклонение ±2 кг").

Пример: если вы анализируете рост учеников в классе, дисперсия покажет "квадратные сантиметры" (неудобно для восприятия), а стандартное отклонение — непосредственно сантиметры.

В Excel стандартное отклонение рассчитывается так:

  • 📏 Для выборки: СТАНДОТКЛОН.В(A1:A10) (аналог СТАНДОТКЛОН в старых версиях).
  • 📏 Для генеральной совокупности: СТАНДОТКЛОН.Г(A1:A10) (аналог СТАНДОТКЛОНП).

Расширенные возможности: дисперсия с условиями

Иногда требуется рассчитать дисперсию не для всех данных, а только для тех, что удовлетворяют определённому условию. Например, дисперсия продаж только по будням или дисперсия оценок только для студентов одной группы.

Для этого комбинируйте ДИСП с функциями фильтрации:

Способ 1: Функция ФИЛЬТР (Excel 365 и 2021)

Если у вас современная версия Excel, используйте динамические массивы:

=ДИСП(ФИЛЬТР(B2:B100; C2:C100="Да"))

Где C2:C100 — столбец с условием (например, "Да/Нет").

Способ 2: Формула массива (для старых версий)

Введите формулу как формулу массива (завершите ввод Ctrl+Shift+Enter):

=ДИСП(ЕСЛИ(C2:C100="Да"; B2:B100))

Способ 3: Вспомогательный столбец

Создайте дополнительный столбец с формулой:

=ЕСЛИ(C2="Да"; B2; "")

Затем рассчитайте дисперсию по этому столбцу, игнорируя пустые ячейки:

=ДИСП(ЕСЛИ(D2:D100<>""; D2:D100))
⚠️ Внимание: При использовании формул массивов в старых версиях Excel (до 2019) не забывайте завершать ввод комбинацией Ctrl+Shift+Enter. В противном случае результат будет неверным!
Как проверить, правильно ли посчитана дисперсия?

Сравните результат с ручным расчётом:

1. Найдите среднее значение (СРЗНАЧ).

2. Вычислите отклонения каждого значения от среднего.

3. Возведите отклонения в квадрат и сложите их.

4. Разделите на n-1 (для выборки) или n (для генеральной совокупности).

Если результаты совпадают, формула введена верно.

Автоматизация расчётов: макросы и Power Query

Если вам регулярно приходится считать дисперсию для больших наборов данных, автоматизируйте процесс с помощью VBA или Power Query.

Макрос для расчёта дисперсии по нескольким столбцам

Скопируйте этот код в редактор VBA (Alt+F11), чтобы создать функцию, которая рассчитывает дисперсию для каждого столбца в выделенном диапазоне:

Sub CalculateVarianceForColumns()

Dim rng As Range

Dim col As Range

Dim lastRow As Long

Dim resultRow As Long

Set rng = Selection

lastRow = rng.Rows.Count

resultRow = rng.Row + lastRow + 1

For Each col In rng.Columns

Cells(resultRow, col.Column).Value = "ДИСП.Г: " & WorksheetFunction.VarP(col)

Cells(resultRow + 1, col.Column).Value = "ДИСП: " & WorksheetFunction.VarS(col)

Next col

End Sub

Чтобы запустить макрос, выделите диапазон и выполните команду из меню Разработчик → Макросы.

Power Query для анализа дисперсии

Power Query позволяет рассчитывать дисперсию при импорте данных:

  1. Импортируйте данные в Power Query (Данные → Получить данные).
  2. Выделите столбец, по которому нужно посчитать дисперсию.
  3. Перейдите на вкладку Добавить столбец → Статистика → Дисперсия.
  4. Выберите тип дисперсии (Выборочная или Генеральная).

Преимущество Power Query: расчёты обновляются автоматически при изменении исходных данных.

FAQ: Частые вопросы о дисперсии в Excel

Почему моя дисперсия отрицательная?

Дисперсия не может быть отрицательной по определению (так как основана на квадратах отклонений). Если вы получили отрицательное значение, проверьте:

  • 🔹 Формулу: возможно, вы случайно вычли дисперсию из другого числа.
  • 🔹 Данные: в диапазоне могут быть ошибки (#ЗНАЧ!) или текст, который интерпретируется как 0.
  • 🔹 Формат ячеек: если результат отображается как дата (например, ######), измените формат на Общий.
Как посчитать дисперсию по группам?

Для расчёта дисперсии по категориям (например, дисперсия продаж по регионам) используйте:

  1. Сводную таблицу: добавьте поле в значения, выберите "Статистическая сводка → Дисперсия".
  2. Формулу массива:
    =ДИСП(ЕСЛИ($A$2:$A$100=D2; $B$2:$B$100))

    где D2 — название группы.

  3. Power Query: сгруппируйте данные по столбцу и выберите агрегацию "Дисперсия".
Можно ли рассчитать дисперсию без Excel?

Да, дисперсию можно посчитать:

  • 📝 Вручную: по формуле Σ(xi - x̄)² / n (для генеральной совокупности) или Σ(xi - x̄)² / (n-1) (для выборки).
  • 📊 В Google Sheets: функции VAR.S (выборка) и VAR.P (генеральная совокупность).
  • 🐍 В Python: с помощью библиотеки numpy:
    import numpy as np
    

    data = [1, 2, 3, 4, 5]

    var_sample = np.var(data, ddof=1) # выборочная

    var_pop = np.var(data) # генеральная

Как визуализировать дисперсию в Excel?

Чтобы наглядно показать разброс данных, используйте:

  • 📌 Гистограмму: показывает распределение значений.
  • 📌 Ящик с усами (Box Plot): в Excel 2016+ доступен через Вставка → Диаграммы → Статистические → Ящик с усами.
  • 📌 Линию тренда с доверительными интервалами: добавьте на график полосы погрешностей (Добавление элемента диаграммы → Полоса погрешностей).

Для Box Plot в старых версиях Excel потребуется ручная настройка или надстройка Analysis ToolPak.

Чем отличаются ДИСП и ДИСП.В?

Функции ДИСП и ДИСП.В рассчитывают выборочную дисперсию, но:

  • ДИСП (англ. VAR.S) — современная функция, рекомендуемая для новых проектов.
  • ДИСП.В (англ. VAR) — устаревшая функция, оставлена для совместимости с Excel 2007 и ранее.

Результаты обеих функций идентичны, но ДИСП поддерживает до 254 аргументов, а ДИСП.В — до 30.