Дисперсия — это статистический показатель, который помогает оценить разброс данных относительно среднего значения. В Microsoft Excel её можно вычислить несколькими способами, но многие пользователи путают функции для генеральной совокупности и выборочной совокупности, что приводит к ошибкам в анализах. Если вы работаете с финансовыми отчётами, научными исследованиями или просто хотите проанализировать вариативность данных — понимание дисперсии критично.
В этой статье мы разберём не только базовые функции вроде ДИСП и ДИСПР, но и нюансы их применения. Вы узнаете, как избежать типичных ошибок при расчётах, визуализировать результаты с помощью графиков и даже автоматизировать процесс для больших массивов данных. А если вы никогда не сталкивались с статистикой — не переживайте: мы начнём с основ.
⚠️ Внимание: Дисперсия чувствительна к выбросам в данных. Один аномально большой или маленький показатель может исказить результат на 20-30%. Перед расчётами всегда проверяйте массив на аномалии с помощью функции =КВАРТИЛЬ() или инструмента "Условное форматирование".
Что такое дисперсия и зачем её считать в Excel
Дисперсия (от англ. variance) показывает, насколько значения в наборе данных отклоняются от среднего арифметического. Чем больше дисперсия, тем сильнее разброс данных. Этот показатель широко используется в:
- 📊 Финансовом анализе — для оценки рисков инвестиционных портфелей (чем выше дисперсия доходности актива, тем он рискованнее).
- 🔬 Научных исследованиях — чтобы подтвердить стабильность экспериментальных данных.
- 🏭 Контроле качества — для мониторинга отклонений в производственных процессах.
- 📈 Маркетинге — при сегментации аудитории по поведенческим признакам.
В Excel дисперсия рассчитывается по формуле:
σ² = Σ(xi — μ)² / N (для генеральной совокупности) или s² = Σ(xi — x̄)² / (n-1) (для выборки), где:
xi— отдельное значение;μ(мю) илиx̄— среднее арифметическое;N/n— количество элементов (с поправкой на выборку).
⚠️ Внимание: Если вы анализируете всю совокупность данных (например, продажи компании за год), используйте функцию для генеральной совокупности. Если работаете с выборкой (опрос 100 клиентов из 10 000), берите функцию для выборочной совокупности — она даёт несмещённую оценку.
Функции Excel для расчёта дисперсии: разница между ДИСП и ДИСПР
В Excel есть 4 основные функции для расчёта дисперсии, и их часто путают. Разберём каждую:
| Функция | Описание | Формула | Пример |
|---|---|---|---|
ДИСП.Г()(VAR.P) |
Дисперсия генеральной совокупности (все данные) | =ДИСП.Г(диапазон) |
=ДИСП.Г(A2:A10) |
ДИСП.В()(VAR.S) |
Дисперсия выборочной совокупности (часть данных) | =ДИСП.В(диапазон) |
=ДИСП.В(B2:B20) |
ДИСП()(VAR) |
Устаревшая функция для выборки (аналог ДИСП.В) |
=ДИСП(диапазон) |
=ДИСП(C2:C15) |
ДИСПР()(VARP) |
Устаревшая функция для генеральной совокупности (аналог ДИСП.Г) |
=ДИСПР(диапазон) |
=ДИСПР(D2:D10) |
Ключевое отличие: функции для выборки (ДИСП.В, ДИСП) делят сумму квадратов отклонений на n-1, а для генеральной совокупности (ДИСП.Г, ДИСПР) — на n. Это называется поправкой Бесселя и нужно для несмещённой оценки.
🔹 Пример: Если у вас данные о росте всех сотрудников компании (100 человек), используйте ДИСП.Г. Если вы измерили рост у 20 случайных сотрудников, чтобы оценить разброс по всей компании — берите ДИСП.В.
Пошаговая инструкция: как посчитать дисперсию в Excel
Рассмотрим расчёт на примере данных о продажах магазина за 10 дней (в ячейках A2:A11):
День │ Продажи (тыс. руб.)
──────┼───────────────────
1 │ 120
2 │ 150
3 │ 90
4 │ 180
5 │ 200
6 │ 110
7 │ 130
8 │ 160
9 │ 140
10 │ 170
Шаг 1. Выделите ячейку для результата (например, B2).
Шаг 2. Введите формулу в зависимости от типа данных:
- 📌 Для генеральной совокупности (все дни месяца):
=ДИСП.Г(A2:A11). - 📌 Для выборки (например, 10 дней из 30):
=ДИСП.В(A2:A11).
Шаг 3. Нажмите Enter. Результат — дисперсия в квадратах единиц измерения (в нашем случае — тыс. руб.²).
🔹 Что делать дальше? Чтобы получить стандартное отклонение (в тех же единицах, что и исходные данные), извлеките квадратный корень из дисперсии:
=КОРЕНЬ(ДИСП.В(A2:A11))
☑️ Проверка перед расчётом дисперсии
Типичные ошибки при расчёте дисперсии и как их избежать
Даже опытные пользователи Excel допускают ошибки при работе с дисперсией. Вот самые распространённые:
- Путают генеральную и выборочную совокупность.
❌ Ошибка: Используют
ДИСП.Гдля данных опроса 100 клиентов из 10 000.✅ Решение: Для выборок всегда берите
ДИСП.В— она даёт более точную оценку. - Не учитывают текстовые или пустые ячейки.
❌ Ошибка: В диапазоне есть ячейка с текстом "Н/Д" — функция вернёт ошибку
#ЗНАЧ!.✅ Решение: Используйте
=ЕСЛИОШИБКА(ДИСП.В(A2:A20); "Ошибка в данных"). - Игнорируют единицы измерения.
❌ Ошибка: Получают дисперсию в "рублях²" и сравнивают её со средним в "рублях".
✅ Решение: Для интерпретации используйте стандартное отклонение (корень из дисперсии).
⚠️ Внимание: Если ваша дисперсия получилась отрицательной — это 100% ошибка в данных. Дисперсия всегда неотрицательна, так как основана на квадратах отклонений. Проверьте формулы на наличие минусов перед функцией или ошибок в диапазонах.
Почему дисперсия может быть равна нулю?
Дисперсия равна нулю только если все значения в наборе данных одинаковые. Например, для массива [5, 5, 5, 5] среднее равно 5, отклонения от среднего равны 0, а значит и дисперсия = 0. В реальных данных это маловероятно и обычно говорит об ошибке (например, скопированные данные или округление).
Визуализация дисперсии: как построить график в Excel
Числовое значение дисперсии не всегда наглядно. Чтобы лучше понять разброс данных, постройте:
- Гистограмму — покажет распределение значений.
Выделите данные →
Вставка → Гистограмма→ выберите тип "С группировкой". - Ящик с усами (Box Plot) — визуализирует квартиль, медиану и выбросы.
В Excel 2016+:
Вставка → Диаграмма → Ящик с усами. - Линию тренда — если данные временные (например, продажи по дням).
Постройте точечную диаграмму и добавьте линию тренда через
Добавить элемент диаграммы.
Критическая деталь: При построении гистограммы Excel по умолчанию выбирает ширину столбцов автоматически. Для корректного анализа дисперсии установите фиксированный размер интервала (например, 10 единиц) через Формат оси → Параметры оси → Размер интервала.
📊 Пример: Для данных о продажах (из предыдущего раздела) гистограмма покажет, что большинство значений сконцентрировано вокруг 140-160 тыс. руб., а дисперсия в 1200 отражает разброс в обе стороны.
Продвинутые методы: дисперсия по условию и динамические расчёты
Если вам нужно рассчитать дисперсию только для части данных, соответствующей определённому критерию, используйте:
1. Формулу массива с ЕСЛИ:
=ДИСП.В(ЕСЛИ(A2:A11>120; A2:A11))
🔹 Примечание: После ввода нажмите Ctrl+Shift+Enter (в старых версиях Excel). В новых версиях формула работает как обычная.
2. Функцию ФИЛЬТР (Excel 365 и 2021):
=ДИСП.В(ФИЛЬТР(A2:A11; A2:A11>120))
3. Сводные таблицы:
- Создайте сводную таблицу по вашим данным.
- Добавьте поле со значениями в область "Значения".
- Нажмите на стрелку рядом с полем →
Параметры полей значений → Дополнительные вычисления → Дисперсия.
🔹 Пример: Рассчитаем дисперсию продаж только для дней, когда выручка превышала 120 тыс. руб.:
=ДИСП.В(ЕСЛИ(A2:A11>120; A2:A11; ""))
Сравнение дисперсии с другими показателями вариативности
Дисперсия — не единственный способ измерить разброс данных. Вот как она соотносится с другими метриками:
| Показатель | Формула в Excel | Когда использовать | Единицы измерения |
|---|---|---|---|
| Дисперсия | ДИСП.Г() / ДИСП.В() |
Для математических расчётов (например, в формулах вероятности) | Квадрат исходных единиц |
| Стандартное отклонение | СТАНДОТКЛОН.Г() / СТАНДОТКЛОН.В() |
Для интерпретации разброса (в тех же единицах, что и данные) | Исходные единицы |
| Размах | =МАКС() - МИН() |
Для быстрой оценки амплитуды колебаний | Исходные единицы |
| Коэффициент вариации | =СТАНДОТКЛОН.В()/СРЗНАЧ() |
Для сравнения разброса данных с разными средними | Проценты (%) |
🔹 Практический совет: Если вам нужно сравнить вариативность двух наборов данных с разными средними (например, продажи в двух магазинах), используйте коэффициент вариации — он нормализует стандартное отклонение относительно среднего.
=СТАНДОТКЛОН.В(A2:A11)/СРЗНАЧ(A2:A11) * 100
FAQ: Частые вопросы о дисперсии в Excel
❓ Почему моя дисперсия сильно отличается от стандартного отклонения?
Потому что стандартное отклонение — это квадратный корень из дисперсии. Например, если дисперсия = 25, то стандартное отклонение = 5. В Excel используйте функции СТАНДОТКЛОН.Г() или СТАНДОТКЛОН.В(), чтобы получить значение в исходных единицах.
❓ Можно ли рассчитать дисперсию для нечисловых данных?
Нет. Дисперсия определена только для количественных данных. Если у вас категориальные переменные (например, цвета или названия), используйте другие методы анализа, например, индекс разнообразия Симпсона.
❓ Как посчитать дисперсию по группам (например, по месяцам)?
Используйте сводные таблицы или функцию АГРЕГАТ с параметром 6 (дисперсия для выборки) или 7 (дисперсия для генеральной совокупности). Пример:
=АГРЕГАТ(6; 6; $B$2:$B$100 / ($A$2:$A$100 = "Январь"))
🔹 Примечание: Это формула массива — в старых версиях Excel завершайте её нажатием Ctrl+Shift+Enter.
❓ В чём разница между ДИСП и ДИСПР в старых версиях Excel?
Функция ДИСП() рассчитывает дисперсию для выборки (делит на n-1), а ДИСПР() — для генеральной совокупности (делит на n). В новых версиях их заменили на ДИСП.В() и ДИСП.Г() соответственно, но старые функции сохранены для обратной совместимости.
❓ Как автоматизировать расчёт дисперсии для больших данных?
Для больших массивов (тысячи строк) используйте:
- Power Query: Импортируйте данные → добавьте столбец с расчётом дисперсии по группам.
- VBA: Напишите макрос, который будет динамически обновлять дисперсию при изменении данных.
- Горячие клавиши: Выделите диапазон →
Alt+M+U+I(для вставки функцииДИСП.В).