Дисперсия — один из ключевых показателей статистики, который характеризует разброс данных относительно среднего значения. В Microsoft Excel её расчёт автоматизирован с помощью специализированных функций, но многие пользователи сталкиваются с путаницей: какие именно формулы использовать, в чём разница между ними и как правильно интерпретировать результаты.
В этой статье мы разберём все способы обозначения дисперсии в Excel, включая функции для выборки и генеральной совокупности, нюансы синтаксиса и типичные ошибки. Вы узнаете, когда применять ДИСП или ДИСП.Г, как учитывать текстовые значения в данных и почему результаты могут отличаться от ручных расчётов. Материал актуален для Excel 2016–2026 (включая Microsoft 365) и подходит как для начинающих, так и для опытных аналитиков.
Что такое дисперсия и зачем она нужна в Excel
Дисперсия (от англ. variance) показывает, насколько значения в наборе данных отклоняются от их среднего арифметического. Чем выше дисперсия, тем сильнее разброс данных. В анализе это помогает:
- 📊 Оценивать стабильность процессов (например, в производстве или финансах).
- 🔍 Выявлять аномалии или выбросы в данных.
- 📈 Строить прогнозные модели (дисперсия используется в регрессионном анализе).
- 🧪 Проверять гипотезы в научных исследованиях.
В Excel дисперсия рассчитывается по формуле:
Для выборки (оценка дисперсии генеральной совокупности по части данных):
ДИСП(число1; [число2]; ...) = SUM((xi - x̄)²) / (n - 1)
Для генеральной совокупности (все данные доступны):
ДИСП.Г(число1; [число2]; ...) = SUM((xi - x̄)²) / n
Где x̄ — среднее значение, n — количество наблюдений.
⚠️ Внимание: Использование неправильной функции (например,ДИСПвместоДИСП.Г) может занизить или завысить результат на 10–30% в зависимости от объёма данных. Всегда уточняйте, анализируете вы выборку или полную совокупность!
Функции дисперсии в Excel: полный список с описанием
В Excel есть 6 функций для расчёта дисперсии, но только 4 из них актуальны для современных версий программы. Разберём каждую:
| Функция | Описание | Пример | Аналог в английской версии |
|---|---|---|---|
ДИСП(число1; [число2]; ...) |
Выборочная дисперсия (смещённая оценка, делитель n-1) |
=ДИСП(A1:A10) |
VAR.S |
ДИСП.В(число1; [число2]; ...) |
Выборочная дисперсия (устаревшая функция, оставлена для совместимости) | =ДИСП.В(A1:A10) |
VAR |
ДИСП.Г(число1; [число2]; ...) |
Дисперсия генеральной совокупности (делитель n) |
=ДИСП.Г(A1:A10) |
VAR.P |
ДИСПР(число1; [число2]; ...) |
Устаревшая функция для генеральной совокупности (аналог ДИСП.Г) |
=ДИСПР(A1:A10) |
VARP |
Важно: функции ДИСП.В и ДИСПР сохранены для обратной совместимости, но в новых проектах рекомендуется использовать ДИСП и ДИСП.Г.
Разница между выборочной и генеральной дисперсией проявляется при малом количестве данных. Например, для массива {1; 2; 3}:
ДИСПвернёт1(делительn-1 = 2).ДИСП.Гвернёт0.666...(делительn = 3).
Практические примеры расчёта дисперсии
Рассмотрим 3 реальных кейса, где требуется посчитать дисперсию в Excel:
Пример 1: Анализ продаж по дням недели
Допустим, у вас есть данные о продажах за 5 дней: 120, 150, 130, 160, 140. Нужно оценить стабильность продаж (выборочная дисперсия).
=ДИСП(120; 150; 130; 160; 140) → Результат: 160
Интерпретация: средний квадрат отклонений от среднего значения (140) составляет 160. Чем меньше это число, тем стабильнее продажи.
Пример 2: Контроль качества на производстве
Вы измерили диаметр 10 деталей (генеральная совокупность): 9.8, 10.1, 9.9, 10.0, 10.2, 9.7, 10.0, 9.9, 10.1, 10.0. Требуется проверить, укладываются ли отклонения в норму (≤ 0.04).
=ДИСП.Г(9.8; 10.1; 9.9; 10.0; 10.2; 9.7; 10.0; 9.9; 10.1; 10.0) → Результат: 0.0256
Вывод: дисперсия в пределах нормы (0.0256 < 0.04).
Пример 3: Оценка волатильности акций
У вас есть дневные доходности акции за месяц (20 значений). Чтобы оценить риск, рассчитайте выборочную дисперсию:
=ДИСП(B2:B21)
Совет: для финансового анализа часто используют стандартное отклонение (корень из дисперсии), которое в Excel рассчитывается функцией СТАНДОТКЛОН.
Удалите пустые ячейки в диапазоне|Убедитесь, что данные числовые (нет текста)|Выберите правильную функцию (ДИСП или ДИСП.Г)|Проверьте делитель (n или n-1)-->
Типичные ошибки и как их избежать
Даже опытные пользователи Excel допускают ошибки при расчёте дисперсии. Вот самые распространённые:
- Использование текста в данных.
Если в диапазоне есть ячейка с текстом (например, "Н/Д"),
ДИСПвернёт ошибку#ЗНАЧ!. Решение: используйте функциюЕСЛИОШИБКАили очистите данные:=ДИСП(ЕСЛИОШИБКА(A1:A10; "")) - Путаница между выборкой и генеральной совокупностью.
Если вы анализируете все доступные данные (например, продажи за год), используйте
ДИСП.Г. Если это часть данных (например, опрос 100 клиентов из 10 000), беритеДИСП. - Игнорирование скрытых ячеек.
Функции дисперсии учитывают все ячейки в диапазоне, даже скрытые. Чтобы их исключить, используйте
ВЫБОРКА:=ДИСП(ЕСЛИ(СТРОКА(A1:A10)-МИН(СТРОКА(A1:A10))+1<=СЧЁТ(A1:A10); A1:A10))
⚠️ Внимание: Если ваш диапазон содержит логические значения (ИСТИНА/ЛОЖЬ), они будут интерпретированы как1/0. Чтобы исключить их, используйтеЕСЛИ:=ДИСП(ЕСЛИ(ТИП(A1:A10)=1; A1:A10))
Дисперсия vs стандартное отклонение: когда что использовать
Дисперсия и стандартное отклонение тесно связаны: стандартное отклонение — это квадратный корень из дисперсии. Но их применение отличается:
| Показатель | Формула в Excel | Когда использовать |
|---|---|---|
| Дисперсия | ДИСП / ДИСП.Г |
Для математических расчётов (например, в формулах регрессии). |
| Стандартное отклонение | СТАНДОТКЛОН.Г / СТАНДОТКЛОН.В |
Для интерпретации разброса в реальных единицах (например, "отклонение ±2 кг"). |
Пример: если вы анализируете рост учеников в классе, дисперсия покажет "квадратные сантиметры" (неудобно для восприятия), а стандартное отклонение — непосредственно сантиметры.
В Excel стандартное отклонение рассчитывается так:
- 📏 Для выборки:
СТАНДОТКЛОН.В(A1:A10)(аналогСТАНДОТКЛОНв старых версиях). - 📏 Для генеральной совокупности:
СТАНДОТКЛОН.Г(A1:A10)(аналогСТАНДОТКЛОНП).
Расширенные возможности: дисперсия с условиями
Иногда требуется рассчитать дисперсию не для всех данных, а только для тех, что удовлетворяют определённому условию. Например, дисперсия продаж только по будням или дисперсия оценок только для студентов одной группы.
Для этого комбинируйте ДИСП с функциями фильтрации:
Способ 1: Функция ФИЛЬТР (Excel 365 и 2021)
Если у вас современная версия Excel, используйте динамические массивы:
=ДИСП(ФИЛЬТР(B2:B100; C2:C100="Да"))
Где C2:C100 — столбец с условием (например, "Да/Нет").
Способ 2: Формула массива (для старых версий)
Введите формулу как формулу массива (завершите ввод Ctrl+Shift+Enter):
=ДИСП(ЕСЛИ(C2:C100="Да"; B2:B100))
Способ 3: Вспомогательный столбец
Создайте дополнительный столбец с формулой:
=ЕСЛИ(C2="Да"; B2; "")
Затем рассчитайте дисперсию по этому столбцу, игнорируя пустые ячейки:
=ДИСП(ЕСЛИ(D2:D100<>""; D2:D100))
⚠️ Внимание: При использовании формул массивов в старых версиях Excel (до 2019) не забывайте завершать ввод комбинацией Ctrl+Shift+Enter. В противном случае результат будет неверным!
Как проверить, правильно ли посчитана дисперсия?
Сравните результат с ручным расчётом:
1. Найдите среднее значение (СРЗНАЧ).
2. Вычислите отклонения каждого значения от среднего.
3. Возведите отклонения в квадрат и сложите их.
4. Разделите на n-1 (для выборки) или n (для генеральной совокупности).
Если результаты совпадают, формула введена верно.
Автоматизация расчётов: макросы и Power Query
Если вам регулярно приходится считать дисперсию для больших наборов данных, автоматизируйте процесс с помощью VBA или Power Query.
Макрос для расчёта дисперсии по нескольким столбцам
Скопируйте этот код в редактор VBA (Alt+F11), чтобы создать функцию, которая рассчитывает дисперсию для каждого столбца в выделенном диапазоне:
Sub CalculateVarianceForColumns()
Dim rng As Range
Dim col As Range
Dim lastRow As Long
Dim resultRow As Long
Set rng = Selection
lastRow = rng.Rows.Count
resultRow = rng.Row + lastRow + 1
For Each col In rng.Columns
Cells(resultRow, col.Column).Value = "ДИСП.Г: " & WorksheetFunction.VarP(col)
Cells(resultRow + 1, col.Column).Value = "ДИСП: " & WorksheetFunction.VarS(col)
Next col
End Sub
Чтобы запустить макрос, выделите диапазон и выполните команду из меню Разработчик → Макросы.
Power Query для анализа дисперсии
Power Query позволяет рассчитывать дисперсию при импорте данных:
- Импортируйте данные в
Power Query(Данные → Получить данные). - Выделите столбец, по которому нужно посчитать дисперсию.
- Перейдите на вкладку
Добавить столбец → Статистика → Дисперсия. - Выберите тип дисперсии (
ВыборочнаяилиГенеральная).
Преимущество Power Query: расчёты обновляются автоматически при изменении исходных данных.
FAQ: Частые вопросы о дисперсии в Excel
Почему моя дисперсия отрицательная?
Дисперсия не может быть отрицательной по определению (так как основана на квадратах отклонений). Если вы получили отрицательное значение, проверьте:
- 🔹 Формулу: возможно, вы случайно вычли дисперсию из другого числа.
- 🔹 Данные: в диапазоне могут быть ошибки (
#ЗНАЧ!) или текст, который интерпретируется как0. - 🔹 Формат ячеек: если результат отображается как дата (например,
######), измените формат наОбщий.
Как посчитать дисперсию по группам?
Для расчёта дисперсии по категориям (например, дисперсия продаж по регионам) используйте:
- Сводную таблицу: добавьте поле в значения, выберите "Статистическая сводка → Дисперсия".
- Формулу массива:
=ДИСП(ЕСЛИ($A$2:$A$100=D2; $B$2:$B$100))где
D2— название группы. - Power Query: сгруппируйте данные по столбцу и выберите агрегацию "Дисперсия".
Можно ли рассчитать дисперсию без Excel?
Да, дисперсию можно посчитать:
- 📝 Вручную: по формуле
Σ(xi - x̄)² / n(для генеральной совокупности) илиΣ(xi - x̄)² / (n-1)(для выборки). - 📊 В Google Sheets: функции
VAR.S(выборка) иVAR.P(генеральная совокупность). - 🐍 В Python: с помощью библиотеки
numpy:import numpy as npdata = [1, 2, 3, 4, 5]
var_sample = np.var(data, ddof=1) # выборочная
var_pop = np.var(data) # генеральная
Как визуализировать дисперсию в Excel?
Чтобы наглядно показать разброс данных, используйте:
- 📌 Гистограмму: показывает распределение значений.
- 📌 Ящик с усами (Box Plot): в Excel 2016+ доступен через
Вставка → Диаграммы → Статистические → Ящик с усами. - 📌 Линию тренда с доверительными интервалами: добавьте на график полосы погрешностей (
Добавление элемента диаграммы → Полоса погрешностей).
Для Box Plot в старых версиях Excel потребуется ручная настройка или надстройка Analysis ToolPak.
Чем отличаются ДИСП и ДИСП.В?
Функции ДИСП и ДИСП.В рассчитывают выборочную дисперсию, но:
ДИСП(англ.VAR.S) — современная функция, рекомендуемая для новых проектов.ДИСП.В(англ.VAR) — устаревшая функция, оставлена для совместимости с Excel 2007 и ранее.
Результаты обеих функций идентичны, но ДИСП поддерживает до 254 аргументов, а ДИСП.В — до 30.