Как посчитать дисперсию в Excel: формулы с примерами и нюансами

Дисперсия — ключевой показатель в статистике, который характеризует разброс данных относительно среднего значения. В Microsoft Excel её расчёт автоматизирован, но выбор правильной функции зависит от контекста: анализируете вы генеральную совокупность (все возможные данные) или выборку (часть данных). Ошибка в выборе формулы исказит результат на 10-15%, а в финансовых или научных расчётах это критично.

В этой статье разберём 4 основные функции Excel для дисперсии (ДИСП.Г, ДИСП.В, ДИСПР, VAR.P/S), покажем, как их применять на реальных примерах, и объясним, почему результаты могут отличаться. Также вы узнаете, как избежать типичных ошибок — например, когда Excel возвращает #ДЕЛ/0! вместо числа, или почему дисперсия вдруг стала отрицательной (спойлер: так не бывает, но пользователи часто путают её с другими метриками).

Чем отличаются ДИСП.Г и ДИСП.В: генеральная vs выборочная дисперсия

Прежде чем вводить формулу, определитесь: ваши данные — это вся совокупность (например, рост всех сотрудников компании) или выборка (рост 50 случайно отобранных сотрудников из 500)? От этого зависит, какую функцию использовать:

  • 📊 ДИСП.Г (или VAR.P в англоязычной версии) — для генеральной совокупности. Делит сумму квадратов отклонений на n (количество элементов).
  • 🔍 ДИСП.В (или VAR.S) — для выборки. Делит на n-1, чтобы скорректировать смещение оценки.

Разница кажется незначительной, но на практике использование ДИСП.Г вместо ДИСП.В для выборки занижает дисперсию на 10-20% (зависит от размера выборки). Например, для 10 элементов ошибка составит ~9%, а для 100 — всего ~1%. В научных исследованиях это может исказить выводы.

📊 Какой тип данных вы чаще анализируете в Excel?
Генеральная совокупность
Выборка
Не знаю разницы
Другой вариант

Пример: у вас данные о продажах за год (12 месяцев). Если это все продажи компании, используйте ДИСП.Г. Если же это продажи только 3 филиалов из 20 — берите ДИСП.В.

⚠️ Внимание: В Excel 2007 и старше функции назывались ДИСП (для выборки) и ДИСПР (для генеральной совокупности). В новых версиях (2010+) их заменили на ДИСП.В и ДИСП.Г, но старые названия до сих пор работают для обратной совместимости.

Пошаговая инструкция: как посчитать дисперсию в Excel

Рассмотрим универсальный алгоритм на примере данных о среднесуточной температуре за неделю (7 значений). Предположим, это генеральная совокупность (все дни недели):

  1. Введите данные в столбец (например, A2:A8): 12, 14, 15, 13, 16, 11, 14.
  2. Выделите ячейку для результата (например, B1).
  3. Введите формулу: =ДИСП.Г(A2:A8) и нажмите Enter.

Excel вернёт значение 3,428... — это и есть дисперсия. Теперь разберём, что произошло "под капотом":

Введены все данные без пропусков|Выбрана правильная функция (ДИСП.Г для совокупности, ДИСП.В для выборки)|Формула применена к диапазону, а не к отдельным ячейкам|Результат — неотрицательное число-->

Если бы это была выборка, формула была бы =ДИСП.В(A2:A8), а результат — 4,114... (на 20% больше!). Почему? Потому что ДИСП.В делит на n-1=6, а не на n=7.

Почему дисперсия не может быть отрицательной?

Дисперсия — это средний квадрат отклонений от среднего. Квадраты всегда неотрицательны, а их среднее тоже. Если Excel показывает отрицательное значение, вы ошиблись в формуле (например, использовали СТАНДОТКЛОН вместо ДИСП или перепутали аргументы в КОВАРИАЦИЯ).

Таблица сравнения функций дисперсии в Excel

Чтобы не путаться в функциях, сохраните эту таблицу или распечатайте её:

Функция Английский аналог Тип данных Формула Пример
ДИСП.Г VAR.P Генеральная совокупность Σ(xi - x̄)² / n =ДИСП.Г(A1:A10)
ДИСП.В VAR.S Выборка Σ(xi - x̄)² / (n-1) =ДИСП.В(B2:B20)
ДИСПР VARP Генеральная совокупность (устаревшая) Σ(xi - x̄)² / n =ДИСПР(C1:C15)
ДИСП VAR Выборка (устаревшая) Σ(xi - x̄)² / (n-1) =ДИСП(D2:D10)

Обратите внимание: функции ДИСП и ДИСПР оставлены для совместимости, но в новых проектах лучше использовать ДИСП.В/ДИСП.Г — они точнее отражают назначение.

Типичные ошибки при расчёте дисперсии и как их избежать

Даже опытные пользователи Excel допускают ошибки при работе с дисперсией. Вот топ-5 проблем и их решения:

  • 🚨 Ошибка #ДЕЛ/0! — возникает, если в диапазоне нет числовых данных или все ячейки пустые. Проверьте диапазон на наличие текста или формул, возвращающих пустоту (например, =ЕСЛИ(A1=0;"";A1/2)).
  • 🔢 Неверный выбор функции — как упоминалось ранее, ДИСП.Г для выборки занижает результат. Используйте ДИСП.В, если данные — часть совокупности.
  • 📉 Путаница с стандартным отклонением — дисперсия это квадрат стандартного отклонения. Если вам нужно последнее, используйте СТАНДОТКЛОН.Г или СТАНДОТКЛОН.В.
  • 🔍 Скрытые символы в данных — пробелы, неразрывные пробелы (CHAR(160)) или апострофы (') делают ячейку текстовой. Используйте =ЧИСТ() или =ЗНАЧЕН() для очистки.
  • 📊 Игнорирование пустых ячеек — функции дисперсии автоматически игнорируют пустые ячейки, но если в них формулы, возвращающие "", Excel посчитает их как 0. Это исказит результат.

Пример ошибки: в диапазоне A1:A5 значения 10, 20, "тридцать", 40, 50. Формула =ДИСП.Г(A1:A5) вернёт #ЗНАЧ!, потому что текстовое значение нельзя преобразовать в число.

Как рассчитать дисперсию вручную (для проверки Excel)

Иногда нужно подтвердить результат Excel — например, при защите диплома или аудите финансовой модели. Вот как посчитать дисперсию без формул:

  1. Найдите среднее значение (=СРЗНАЧ(A1:A10)).
  2. Для каждого числа вычислите отклонение от среднего: =A1-СРЗНАЧ($A$1:$A$10).
  3. Возведите отклонения в квадрат: =(A1-СРЗНАЧ($A$1:$A$10))^2.
  4. Суммируйте квадраты отклонений: =СУММ(...).
  5. Для генеральной совокупности разделите сумму на n, для выборки — на n-1.

Пример для данных [5, 7, 8, 7, 6]:

  1. Среднее = (5+7+8+7+6)/5 = 6,6.
  2. Квадраты отклонений: (5-6.6)²=2.56; (7-6.6)²=0.16; (8-6.6)²=1.96; (7-6.6)²=0.16; (6-6.6)²=0.36.
  3. Сумма квадратов = 2.56 + 0.16 + 1.96 + 0.16 + 0.36 = 5,2.
  4. Дисперсия (генеральная) = 5,2 / 5 = 1,04.
  5. Дисперсия (выборочная) = 5,2 / 4 = 1,3.

Сравните с Excel:

  • =ДИСП.Г(A1:A5) → 1,04 ✅
  • =ДИСП.В(A1:A5) → 1,3 ✅

Дисперсия для группированных данных: формула с частотами

Если данные сгруппированы (например, интервалы роста с количеством людей в каждом), используйте формулу дисперсии с учётом частот:

1. Создайте таблицу с интервалами (A2:A5) и частотами (B2:B5):


| Интервал | Частота |

|----------|---------|

| 160-165 | 5 |

| 165-170 | 18 |

| 170-175 | 22 |

| 175-180 | 8 |

2. Найдите середины интервалов (C2:C5): для 160-165 это (160+165)/2=162,5.

3. Рассчитайте среднее взвешенное: =СУММПРОИЗВ(C2:C5; B2:B5)/СУММ(B2:B5).

4. Для дисперсии используйте:

=СУММПРОИЗВ(B2:B5; (C2:C5-СРЗНАЧВЗВЕШ(C2:C5; B2:B5))^2)) / СУММ(B2:B5)

Эта формула учитывает "вес" каждой группы. В нашем примере результат будет ~25,3 (если точные середины интервалов 162.5, 167.5, 172.5, 177.5).

Дисперсия в Excel Online и Google Sheets: есть ли различия?

Функции дисперсии в Excel Online и Google Sheets идентичны по синтаксису, но есть нюансы:

  • 🌐 Excel Online:
    • Поддерживает ДИСП.Г/ДИСП.В и устаревшие ДИСП/ДИСПР.
    • Ограничение на размер файла — до 5 ГБ (в отличие от 100 МБ в десктопной версии).
  • 📊 Google Sheets:
    • Использует те же названия функций, но на английском: VAR.P, VAR.S.
    • Поддерживает ARRAYFORMULA для динамических диапазонов, чего нет в Excel.
    • Автоматически обновляет результаты при изменении данных (в Excel Online нужно нажать F9).

Пример формулы в Google Sheets для выборки:

=VAR.S(A2:A100)

Важно: в Google Sheets нет русскоязычных названий функций — только английские. Также здесь нет функции ДИСПР (она заменена на VAR.P).

⚠️ Внимание: В Google Sheets функция VAR (без суффикса) эквивалентна VAR.S (выборочная дисперсия), а не VAR.P! Это частая причина ошибок при переносе файлов между платформами.

FAQ: Частые вопросы о дисперсии в Excel

Можно ли рассчитать дисперсию для текстовых данных?

Нет. Функции дисперсии работают только с числовыми значениями. Если в диапазоне есть текст, Excel вернёт ошибку #ЗНАЧ!. Предварительно преобразуйте текст в числа с помощью =ЗНАЧЕН() или удалите нечисловые ячейки.

Почему моя дисперсия отрицательная?

Дисперсия по определению не может быть отрицательной — это сумма квадратов, делённая на положительное число. Если вы получили отрицательное значение, вы ошиблись в формуле. Частые причины:

  • Использовали КОВАРИАЦИЯ вместо ДИСП.
  • В диапазоне есть формулы, возвращающие отрицательные квадраты (например, =-A1^2).
  • Перепутали аргументы в пользовательской функции VBA.

Проверьте формулу и исходные данные.

Как найти дисперсию по условию (например, только для значений >10)?summary>

Используйте формулу массива (введите с Ctrl+Shift+Enter в старых версиях Excel):

=ДИСП.В(ЕСЛИ(A1:A10>10; A1:A10))

В Excel 365 или 2019+ можно просто:

=ДИСП.В(ФИЛЬТР(A1:A10; A1:A10>10))

Альтернатива — создать вспомогательный столбец с фильтром и применить ДИСП.В к нему.

Чем дисперсия отличается от стандартного отклонения?

Дисперсия (ДИСП) — это средний квадрат отклонений от среднего. Стандартное отклонение (СТАНДОТКЛОН) — корень квадратный из дисперсии. Оно измеряется в тех же единицах, что и исходные данные (например, если данные в метрах, то стандартное отклонение тоже в метрах, а дисперсия — в м²). Формула связи:

СТАНДОТКЛОН = КОРЕНЬ(ДИСП)

В Excel для генеральной совокупности: =СТАНДОТКЛОН.Г(A1:A10)=КОРЕНЬ(ДИСП.Г(A1:A10)).

Можно ли рассчитать дисперсию для нескольких столбцов одновременно?

Да, но нужно объединить данные в один диапазон. Например, для столбцов A1:A10 и B1:B10:

=ДИСП.Г(A1:B10)

Или используйте ОБЪЕДИНИТЬ (в Excel 365):

=ДИСП.Г(ОБЪЕДИНИТЬ(A1:A10; B1:B10))

Важно: Excel воспринимает такой диапазон как один массив, поэтому среднее и дисперсия будут рассчитаны для всех значений вместе.