Дисперсия — это статистический показатель, который демонстрирует, насколько значения в наборе данных отклоняются от среднего. В Microsoft Excel её расчёт автоматизирован с помощью встроенных функций, но многие пользователи сталкиваются с путаницей: какую формулу выбрать, как правильно интерпретировать результат и почему значения отличаются от ручных вычислений. Эта статья разберёт все способы расчёта дисперсии в Excel — от базовых функций до продвинутых нюансов для генеральных и выборочных совокупностей.
Мы не просто перечислим функции, а покажем, как они работают на реальных данных, какие ошибки чаще всего допускают новички и как избежать типичных ловушек. Например, почему ДИСП.Г и ДИСП.В дают разные результаты для одного и того же массива чисел, и когда нужно использовать каждую из них. Если вы анализируете финансовые отчёты, научные эксперименты или просто хотите понять вариативность своих данных — этот гайд поможет разобраться во всём без лишней теории.
Дисперсия в Excel рассчитывается по формуле, которая учитывает квадраты отклонений каждого значения от среднего. Но в зависимости от типа данных (выборка или генеральная совокупность) и версии Excel (до 2010 года или после) — функции будут отличаться. Например, устаревшие ДИСП и ДИСПР до сих пор встречаются в старых файлах, а современные ДИСП.Г и ДИСП.В более точны и поддерживают массивы. Мы разберём каждую из них, а также покажем, как считать дисперсию вручную для проверки результатов.
Что такое дисперсия и зачем её считать в Excel
Дисперсия (от англ. variance) — это мера разброса данных вокруг среднего значения. Чем больше дисперсия, тем сильнее значения в наборе отличаются друг от друга. В Excel её используют для:
- 📊 Статистического анализа: оценка вариативности продаж, температуры, ошибок измерений.
- 💰 Финансового моделирования: расчёт рисков портфеля акций или волатильности курсов валют.
- 🔬 Научных исследований: проверка гипотез, сравнение выборок в экспериментах.
- 📈 Контроля качества: мониторинг отклонений в производственных процессах.
Формула дисперсии вручную выглядит так:
σ² = Σ(xi — μ)² / N
где:
σ²— дисперсия,xi— каждое значение в наборе,μ— среднее арифметическое,N— количество значений.
Но в Excel есть готовые функции, которые экономят время. Главное — понять, какую из них применять.
Ключевое отличие: дисперсия для генеральной совокупности (всех данных) и для выборки (части данных) считается по-разному. Если вы анализируете все возможные значения (например, рост всех сотрудников компании), используйте одну формулу. Если у вас только часть данных (например, опрос 100 клиентов из 10 000), нужна другая.
Функции дисперсии в Excel: сравнение и синтаксис
В Excel есть 4 основные функции для расчёта дисперсии. Их отличие — в типе данных и версии программы:
| Функция | Тип данных | Версия Excel | Формула |
|---|---|---|---|
ДИСП.Г |
Генеральная совокупность | 2010 и новее | =ДИСП.Г(числа) |
ДИСП.В |
Выборка | 2010 и новее | =ДИСП.В(числа) |
ДИСПР |
Генеральная совокупность | До 2010 | =ДИСПР(числа) |
ДИСП |
Выборка | До 2010 | =ДИСП(числа) |
ДИСП.Г и ДИСП.В — современные аналоги устаревших ДИСПР и ДИСП. Они поддерживают до 255 аргументов (против 30 в старых версиях) и лучше работают с массивами. Например, если у вас данные в диапазоне A1:A100, современные функции обработают их без ошибок, а старые могут выдавать неверный результат.
Синтаксис всех функций одинаковый:
=ДИСП.Г(число1; [число2]; ...)
=ДИСП.В(А1:А10)
Аргументы могут быть:
- 📌 Отдельными числами:
=ДИСП.Г(5; 10; 15) - 📌 Ссылками на ячейки:
=ДИСП.В(A2:A20) - 📌 Смешанными:
=ДИСП.Г(5; A2:A10; 20)
Почему в Excel две функции для дисперсии?
Выборочная дисперсия (ДИСП.В) делит сумму квадратов отклонений на n-1 (где n — количество элементов), чтобы компенсировать смещение оценки. Это называется "поправкой Бесселя". Генеральная дисперсия (ДИСП.Г) делит на n, так как анализирует все данные без исключений.
Пошаговая инструкция: как посчитать дисперсию в Excel
Разберём расчёт на примере. Допустим, у нас есть данные о дневной выручке магазина за 10 дней (в ячейках A2:A11):
| День | Выручка (тыс. руб.) |
|-------|---------------------|
| 1 | 120 |
| 2 | 150 |
| ... | ... |
| 10 | 130 |
Шаг 1. Определите тип данных:
- ✅ Если это все дни работы магазина (генеральная совокупность) — используйте
ДИСП.Г. - ✅ Если это выборка (например, 10 дней из 100) — берите
ДИСП.В.
Шаг 2. Введите формулу. Для генеральной совокупности:
=ДИСП.Г(A2:A11)
Для выборки:
=ДИСП.В(A2:A11)
Шаг 3. Нажмите Enter. Excel вернёт значение дисперсии. Например, для выборки с данными [120, 150, 130, ..., 140] результат может быть 165.56.
Сравните результат с ручным расчётом по формуле|Проверьте, что в диапазоне нет пустых ячеек или текста|Убедитесь, что выбрана правильная функция (Г или В)|Округлите результат до 2 знаков после запятой для удобства-->
Пример с реальными данными:
Предположим, у нас есть выборка из 5 значений: 10, 12, 14, 16, 18.
- Среднее арифметическое:
(10+12+14+16+18)/5 = 14. - Квадраты отклонений:
(10-14)²=16,(12-14)²=4, ...,(18-14)²=16. - Сумма квадратов:
16 + 4 + 0 + 4 + 16 = 40. - Дисперсия выборки:
40 / (5-1) = 10(функцияДИСП.Ввернёт 10). - Дисперсия генеральной совокупности:
40 / 5 = 8(функцияДИСП.Гвернёт 8).
Типичные ошибки при расчёте дисперсии и как их избежать
Даже опытные пользователи Excel допускают ошибки при работе с дисперсией. Вот самые распространённые:
⚠️ Внимание: Если в диапазоне есть пустые ячейки или текст, Excel проигнорирует их, но это исказит результат. Всегда проверяйте данные на целостность!
Ошибка 1. Путаница между ДИСП.Г и ДИСП.В
Многие используют ДИСП.Г для выборки, не понимая, что это занижает дисперсию. Например, для данных [5, 7, 9]:
ДИСП.Гвернёт8/3 ≈ 2.67.ДИСП.Ввернёт8/2 = 4(правильно для выборки!).
Ошибка 2. Использование устаревших функций
В Excel 2019 функция ДИСП всё ещё работает, но она рассчитана на выборку и может ввести в заблуждение. Например:
=ДИСП(A1:A10) // Устарело! Лучше использовать ДИСП.В
=ДИСПР(A1:A10) // Устарело! Лучше ДИСП.Г
Ошибка 3. Неучёт скрытых символов
Если ячейка выглядит пустой, но содержит пробел или неразрывный пробел (CHAR(160)), Excel посчитает её как 0. Это исказит среднее и дисперсию. Чтобы проверить:
=ЕПУСТО(A1) // Вернёт ЛОЖЬ, если ячейка не совсем пуста
Ошибка 4. Неправильное округление
Дисперсия часто выводится с большим количеством знаков после запятой. Используйте =ОКРУГЛ(ДИСП.В(A1:A10); 2), чтобы получить читаемый результат.
⚠️ Внимание: Если дисперсия получилась отрицательной — в данных есть ошибка (например, текст вместо чисел или формулы вместо значений). Проверьте диапазон функцией =ТИП(A1).
Расчёт дисперсии вручную: проверка результатов Excel
Чтобы убедиться, что Excel считает дисперсию правильно, можно провести расчёт вручную. Возьмём тот же пример с выручкой магазина:
Данные: 120, 150, 130, 140, 160, 110, 170, 125, 135, 155.
Шаг 1. Найдите среднее арифметическое (μ):
=СРЗНАЧ(A2:A11) // Допустим, результат 139.5
Шаг 2. Посчитайте квадраты отклонений для каждого значения:
(120 — 139.5)² = 380.25(150 — 139.5)² = 110.25- ... и так далее для всех 10 значений.
Шаг 3. Суммируйте квадраты отклонений:
=СУММ((A2:A11-СРЗНАЧ(A2:A11))^2)
Это массивная формула — введите её как CTRL+SHIFT+ENTER в старых версиях Excel.
Шаг 4. Разделите сумму на n (для генеральной совокупности) или n-1 (для выборки):
=СУММКВРАЗН(A2:A11;СРЗНАЧ(A2:A11))/10 // ДИСП.Г
=СУММКВРАЗН(A2:A11;СРЗНАЧ(A2:A11))/9 // ДИСП.В
Сравните результат с
Функция =ДИСП.Г(A2:A11) и =ДИСП.В(A2:A11) — они должны совпадать.
Формула СУММКВРАЗН
СУММКВРАЗН — это сокращение для суммы квадратов разностей. Она эквивалентна =СУММ((A2:A11-СРЗНАЧ(A2:A11))^2), но работает быстрее и не требует массива.
Продвинутые приёмы: дисперсия по условию и для группированных данных
Иногда нужно посчитать дисперсию не для всех данных, а только для тех, что удовлетворяют условию. Например, дисперсию выручки только по будням или только по значениям выше среднего.
Способ 1. Фильтрация + ДИСП.В
Добавьте вспомогательный столбец с условием (например, =ЕСЛИ(B2="будний"; A2; "")), затем используйте:
=ДИСП.В(ЕСЛИ(C2:C11<>""; C2:C11))
Введите как массивовую формулу (CTRL+SHIFT+ENTER в Excel 2019 и старше).
Способ 2. Функция ФИЛЬТР (Excel 365)
В новых версиях Excel можно использовать динамические массивы:
=ДИСП.В(ФИЛЬТР(A2:A11; B2:B11="будний"))
Дисперсия для группированных данных
Если данные сгруппированы (например, выручка по регионам), используйте СУММПРОИЗВ:
=СУММПРОИЗВ((A2:A11-СРЗНАЧ(A2:A11))^2; (B2:B11="Регион1")) / СЧЁТЕСЛИ(B2:B11; "Регион1")
Для расчёта межгрупповой дисперсии (например, между регионами) используйте анализ дисперсии (ANOVA) через надстройку Пакет анализа (Данные → Анализ данных → Однофакторный дисперсионный анализ).
Сравнение дисперсии в Excel и других программах
Excel не единственный инструмент для расчёта дисперсии. Сравним его с альтернативами:
| Программа | Функция для дисперсии | Особенности |
|---|---|---|
| Excel | ДИСП.Г, ДИСП.В |
Простота, интеграция с таблицами, поддержка массивов. |
| Google Sheets | VAR.P, VAR.S |
Аналогично Excel, но с поддержкой совместного редактирования. |
| Python (NumPy) | np.var() |
Требует знания программирования, но гибче для больших данных. |
| R | var() |
Стандарт для статистики, поддерживает сложные модели. |
Excel уступает Python и R в обработке больших данных (миллионы строк), но выигрывает в простоте и визуализации. Например, в Excel можно сразу построить гистограмму распределения данных с указанием дисперсии, тогда как в Python для этого потребуется дополнительный код с matplotlib.
Когда выбирать Excel:
- 📄 Данные помещаются в таблицу (до 1 млн строк).
- 📊 Нужна визуализация (графики, сводные таблицы).
- 👥 Работа в команде, где не все знают программирование.
Когда выбрать альтернативы:
- 🐍 Данные больше 1 млн строк (используйте Python с
pandas). - 📈 Нужны сложные статистические тесты (например, регрессия в R).
- ☁️ Работа в облаке с совместным доступом (Google Sheets).
FAQ: Частые вопросы о дисперсии в Excel
Почему моя дисперсия отрицательная?
Отрицательная дисперсия — это ошибка. Причины:
- В данных есть текст или пустые ячейки, которые Excel воспринимает как 0.
- Использована неверная формула (например, вместо квадратов отклонений взяты просто отклонения).
- Вручную делили на неправильное число (например, на
n+1вместоn-1).
Проверьте данные функцией =ЕЧИСЛО(A1) и пересчитайте вручную.
Можно ли посчитать дисперсию для нечисловых данных?
Нет. Дисперсия рассчитывается только для количественных данных. Если у вас категориальные данные (например, "да/нет"), используйте другие меры вариативности, например, индекс разнообразия или энтропию.
Как посчитать дисперсию по нескольким столбцам?
Объедините данные в один диапазон:
=ДИСП.В(A2:A100; C2:C100)
Или используйте массивовую формулу:
=ДИСП.В(ЕСЛИ(A2:A100<>""; A2:A100; C2:C100))
В Excel 365 можно использовать ОБЪЕДИНИТЬ:
=ДИСП.В(ОБЪЕДИНИТЬ(A2:A100; C2:C100))
Чем дисперсия отличается от стандартного отклонения?
Стандартное отклонение — это квадратный корень из дисперсии. В Excel его считают функциями СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В. Дисперсия показывает разброс в "квадратах исходных единиц", а стандартное отклонение — в тех же единицах, что и данные (рубли, градусы и т.д.).
Как визуализировать дисперсию в Excel?
Постройте гистограмму с указанием среднего и границ μ ± σ (где σ — стандартное отклонение). Для этого:
- Выделите данные.
- Вкладка
Вставка → Гистограмма. - Добавьте линию среднего:
Макет → Линия тренда → Среднее.
Также можно использовать ящик с усами (Вставка → Диаграмма → Ящик с усами), где дисперсия отражается в ширине "усов".