Дисперсия — ключевой показатель в статистике, который характеризует разброс данных относительно среднего значения. В Microsoft Excel её расчёт автоматизирован, но выбор правильной функции зависит от контекста: анализируете вы генеральную совокупность (все возможные данные) или выборку (часть данных). Ошибка в выборе формулы исказит результат на 10-15%, а в финансовых или научных расчётах это критично.
В этой статье разберём 4 основные функции Excel для дисперсии (ДИСП.Г, ДИСП.В, ДИСПР, VAR.P/S), покажем, как их применять на реальных примерах, и объясним, почему результаты могут отличаться. Также вы узнаете, как избежать типичных ошибок — например, когда Excel возвращает #ДЕЛ/0! вместо числа, или почему дисперсия вдруг стала отрицательной (спойлер: так не бывает, но пользователи часто путают её с другими метриками).
Чем отличаются ДИСП.Г и ДИСП.В: генеральная vs выборочная дисперсия
Прежде чем вводить формулу, определитесь: ваши данные — это вся совокупность (например, рост всех сотрудников компании) или выборка (рост 50 случайно отобранных сотрудников из 500)? От этого зависит, какую функцию использовать:
- 📊 ДИСП.Г (или
VAR.Pв англоязычной версии) — для генеральной совокупности. Делит сумму квадратов отклонений наn(количество элементов). - 🔍 ДИСП.В (или
VAR.S) — для выборки. Делит наn-1, чтобы скорректировать смещение оценки.
Разница кажется незначительной, но на практике использование ДИСП.Г вместо ДИСП.В для выборки занижает дисперсию на 10-20% (зависит от размера выборки). Например, для 10 элементов ошибка составит ~9%, а для 100 — всего ~1%. В научных исследованиях это может исказить выводы.
Пример: у вас данные о продажах за год (12 месяцев). Если это все продажи компании, используйте ДИСП.Г. Если же это продажи только 3 филиалов из 20 — берите ДИСП.В.
⚠️ Внимание: В Excel 2007 и старше функции называлисьДИСП(для выборки) иДИСПР(для генеральной совокупности). В новых версиях (2010+) их заменили наДИСП.ВиДИСП.Г, но старые названия до сих пор работают для обратной совместимости.
Пошаговая инструкция: как посчитать дисперсию в Excel
Рассмотрим универсальный алгоритм на примере данных о среднесуточной температуре за неделю (7 значений). Предположим, это генеральная совокупность (все дни недели):
- Введите данные в столбец (например,
A2:A8): 12, 14, 15, 13, 16, 11, 14. - Выделите ячейку для результата (например,
B1). - Введите формулу:
=ДИСП.Г(A2:A8)и нажмитеEnter.
Excel вернёт значение 3,428... — это и есть дисперсия. Теперь разберём, что произошло "под капотом":
Введены все данные без пропусков|Выбрана правильная функция (ДИСП.Г для совокупности, ДИСП.В для выборки)|Формула применена к диапазону, а не к отдельным ячейкам|Результат — неотрицательное число-->
Если бы это была выборка, формула была бы =ДИСП.В(A2:A8), а результат — 4,114... (на 20% больше!). Почему? Потому что ДИСП.В делит на n-1=6, а не на n=7.
Почему дисперсия не может быть отрицательной?
Дисперсия — это средний квадрат отклонений от среднего. Квадраты всегда неотрицательны, а их среднее тоже. Если Excel показывает отрицательное значение, вы ошиблись в формуле (например, использовали СТАНДОТКЛОН вместо ДИСП или перепутали аргументы в КОВАРИАЦИЯ).
Таблица сравнения функций дисперсии в Excel
Чтобы не путаться в функциях, сохраните эту таблицу или распечатайте её:
| Функция | Английский аналог | Тип данных | Формула | Пример |
|---|---|---|---|---|
ДИСП.Г |
VAR.P |
Генеральная совокупность | Σ(xi - x̄)² / n | =ДИСП.Г(A1:A10) |
ДИСП.В |
VAR.S |
Выборка | Σ(xi - x̄)² / (n-1) | =ДИСП.В(B2:B20) |
ДИСПР |
VARP |
Генеральная совокупность (устаревшая) | Σ(xi - x̄)² / n | =ДИСПР(C1:C15) |
ДИСП |
VAR |
Выборка (устаревшая) | Σ(xi - x̄)² / (n-1) | =ДИСП(D2:D10) |
Обратите внимание: функции ДИСП и ДИСПР оставлены для совместимости, но в новых проектах лучше использовать ДИСП.В/ДИСП.Г — они точнее отражают назначение.
Типичные ошибки при расчёте дисперсии и как их избежать
Даже опытные пользователи Excel допускают ошибки при работе с дисперсией. Вот топ-5 проблем и их решения:
- 🚨 Ошибка #ДЕЛ/0! — возникает, если в диапазоне нет числовых данных или все ячейки пустые. Проверьте диапазон на наличие текста или формул, возвращающих пустоту (например,
=ЕСЛИ(A1=0;"";A1/2)). - 🔢 Неверный выбор функции — как упоминалось ранее,
ДИСП.Гдля выборки занижает результат. ИспользуйтеДИСП.В, если данные — часть совокупности. - 📉 Путаница с стандартным отклонением — дисперсия это квадрат стандартного отклонения. Если вам нужно последнее, используйте
СТАНДОТКЛОН.ГилиСТАНДОТКЛОН.В. - 🔍 Скрытые символы в данных — пробелы, неразрывные пробелы (
CHAR(160)) или апострофы (') делают ячейку текстовой. Используйте=ЧИСТ()или=ЗНАЧЕН()для очистки. - 📊 Игнорирование пустых ячеек — функции дисперсии автоматически игнорируют пустые ячейки, но если в них формулы, возвращающие
"", Excel посчитает их как 0. Это исказит результат.
Пример ошибки: в диапазоне A1:A5 значения 10, 20, "тридцать", 40, 50. Формула =ДИСП.Г(A1:A5) вернёт #ЗНАЧ!, потому что текстовое значение нельзя преобразовать в число.
Как рассчитать дисперсию вручную (для проверки Excel)
Иногда нужно подтвердить результат Excel — например, при защите диплома или аудите финансовой модели. Вот как посчитать дисперсию без формул:
- Найдите среднее значение (
=СРЗНАЧ(A1:A10)). - Для каждого числа вычислите отклонение от среднего:
=A1-СРЗНАЧ($A$1:$A$10). - Возведите отклонения в квадрат:
=(A1-СРЗНАЧ($A$1:$A$10))^2. - Суммируйте квадраты отклонений:
=СУММ(...). - Для генеральной совокупности разделите сумму на
n, для выборки — наn-1.
Пример для данных [5, 7, 8, 7, 6]:
- Среднее = (5+7+8+7+6)/5 = 6,6.
- Квадраты отклонений: (5-6.6)²=2.56; (7-6.6)²=0.16; (8-6.6)²=1.96; (7-6.6)²=0.16; (6-6.6)²=0.36.
- Сумма квадратов = 2.56 + 0.16 + 1.96 + 0.16 + 0.36 = 5,2.
- Дисперсия (генеральная) = 5,2 / 5 = 1,04.
- Дисперсия (выборочная) = 5,2 / 4 = 1,3.
Сравните с Excel:
=ДИСП.Г(A1:A5)→ 1,04 ✅=ДИСП.В(A1:A5)→ 1,3 ✅
Дисперсия для группированных данных: формула с частотами
Если данные сгруппированы (например, интервалы роста с количеством людей в каждом), используйте формулу дисперсии с учётом частот:
1. Создайте таблицу с интервалами (A2:A5) и частотами (B2:B5):
| Интервал | Частота |
|----------|---------|
| 160-165 | 5 |
| 165-170 | 18 |
| 170-175 | 22 |
| 175-180 | 8 |
2. Найдите середины интервалов (C2:C5): для 160-165 это (160+165)/2=162,5.
3. Рассчитайте среднее взвешенное: =СУММПРОИЗВ(C2:C5; B2:B5)/СУММ(B2:B5).
4. Для дисперсии используйте:
=СУММПРОИЗВ(B2:B5; (C2:C5-СРЗНАЧВЗВЕШ(C2:C5; B2:B5))^2)) / СУММ(B2:B5)
Эта формула учитывает "вес" каждой группы. В нашем примере результат будет ~25,3 (если точные середины интервалов 162.5, 167.5, 172.5, 177.5).
Дисперсия в Excel Online и Google Sheets: есть ли различия?
Функции дисперсии в Excel Online и Google Sheets идентичны по синтаксису, но есть нюансы:
- 🌐 Excel Online:
- Поддерживает
ДИСП.Г/ДИСП.Ви устаревшиеДИСП/ДИСПР. - Ограничение на размер файла — до 5 ГБ (в отличие от 100 МБ в десктопной версии).
- Поддерживает
- 📊 Google Sheets:
- Использует те же названия функций, но на английском:
VAR.P,VAR.S. - Поддерживает
ARRAYFORMULAдля динамических диапазонов, чего нет в Excel. - Автоматически обновляет результаты при изменении данных (в Excel Online нужно нажать
F9).
- Использует те же названия функций, но на английском:
Пример формулы в Google Sheets для выборки:
=VAR.S(A2:A100)
Важно: в Google Sheets нет русскоязычных названий функций — только английские. Также здесь нет функции ДИСПР (она заменена на VAR.P).
⚠️ Внимание: В Google Sheets функцияVAR(без суффикса) эквивалентнаVAR.S(выборочная дисперсия), а неVAR.P! Это частая причина ошибок при переносе файлов между платформами.
FAQ: Частые вопросы о дисперсии в Excel
Можно ли рассчитать дисперсию для текстовых данных?
Нет. Функции дисперсии работают только с числовыми значениями. Если в диапазоне есть текст, Excel вернёт ошибку #ЗНАЧ!. Предварительно преобразуйте текст в числа с помощью =ЗНАЧЕН() или удалите нечисловые ячейки.
Почему моя дисперсия отрицательная?
Дисперсия по определению не может быть отрицательной — это сумма квадратов, делённая на положительное число. Если вы получили отрицательное значение, вы ошиблись в формуле. Частые причины:
- Использовали
КОВАРИАЦИЯвместоДИСП. - В диапазоне есть формулы, возвращающие отрицательные квадраты (например,
=-A1^2). - Перепутали аргументы в пользовательской функции VBA.
Проверьте формулу и исходные данные.
Как найти дисперсию по условию (например, только для значений >10)?summary>
Используйте формулу массива (введите с Ctrl+Shift+Enter в старых версиях Excel):
=ДИСП.В(ЕСЛИ(A1:A10>10; A1:A10))
В Excel 365 или 2019+ можно просто:
=ДИСП.В(ФИЛЬТР(A1:A10; A1:A10>10))
Альтернатива — создать вспомогательный столбец с фильтром и применить ДИСП.В к нему.
Ctrl+Shift+Enter в старых версиях Excel):
=ДИСП.В(ЕСЛИ(A1:A10>10; A1:A10))=ДИСП.В(ФИЛЬТР(A1:A10; A1:A10>10))ДИСП.В к нему.Чем дисперсия отличается от стандартного отклонения?
Дисперсия (ДИСП) — это средний квадрат отклонений от среднего. Стандартное отклонение (СТАНДОТКЛОН) — корень квадратный из дисперсии. Оно измеряется в тех же единицах, что и исходные данные (например, если данные в метрах, то стандартное отклонение тоже в метрах, а дисперсия — в м²). Формула связи:
СТАНДОТКЛОН = КОРЕНЬ(ДИСП)
В Excel для генеральной совокупности: =СТАНДОТКЛОН.Г(A1:A10) ≡ =КОРЕНЬ(ДИСП.Г(A1:A10)).
Можно ли рассчитать дисперсию для нескольких столбцов одновременно?
Да, но нужно объединить данные в один диапазон. Например, для столбцов A1:A10 и B1:B10:
=ДИСП.Г(A1:B10)
Или используйте ОБЪЕДИНИТЬ (в Excel 365):
=ДИСП.Г(ОБЪЕДИНИТЬ(A1:A10; B1:B10))
Важно: Excel воспринимает такой диапазон как один массив, поэтому среднее и дисперсия будут рассчитаны для всех значений вместе.