Как сделать распределение Гаусса в Excel: формулы, графики и ошибки

При попытке визуализировать нормальное распределение в Microsoft Excel пользователи часто сталкиваются с двумя проблемами: формула НОРМ.РАСП возвращает ошибку #ЗНАЧ!, или график получается асимметричным из-за неправильно заданных параметров среднего и стандартного отклонения. Эти ошибки возникают, если вводить данные вручную без проверки статистических характеристик исходного массива. Например, при среднем значении μ=50 и стандартном отклонении σ=10 кривая смещается влево, если в формуле случайно перепутать аргументы местами.

В этой статье разберём 3 рабочих способа построения гауссова распределения — от простого графика плотности вероятности до динамической модели с ползунками для изменения параметров. Особое внимание уделим типичным ошибкам при работе с функцией НОРМ.ОБР (обратное нормальное распределение) и способам их обхода. Все примеры протестированы в Excel 2019 и Excel 365, но подойдут и для версий 2016–2013 с минимальными корректировками.

1. Подготовка данных: среднее и стандартное отклонение

Перед построением графика нормального распределения необходимо рассчитать два ключевых параметра: среднее арифметическое (μ) и стандартное отклонение (σ). Без них формулы вернут некорректные значения. Например, если вы пытаетесь смоделировать распределение роста людей, но используете стандартное отклонение σ=5 вместо реального σ=10, кривая будет слишком «узкой» и не отразит реальную вариативность данных.

Вот как рассчитать параметры для существующего набора данных:

  • 📊 Для среднего используйте формулу: =СРЗНАЧ(диапазон). Например, =СРЗНАЧ(A2:A100).
  • 📉 Для стандартного отклонения подходит =СТАНДОТКЛОН.В(диапазон) (для выборки) или =СТАНДОТКЛОН.Г(диапазон) (для генеральной совокупности).
  • ⚠️ Если данные содержат пустые ячейки или текст, Excel проигнорирует их автоматически, но лучше заранее очистить диапазон функцией =ЕСЛИОШИБКА().

Для моделирования «идеального» распределения без исходных данных можно задать параметры вручную. Типичные значения:

  • 🎯 μ=0 и σ=1 — стандартное нормальное распределение.
  • 📏 μ=100 и σ=15 — подходит для моделирования IQ (коэффициент интеллекта).
⚠️ Внимание: Если стандартное отклонение (σ) равно нулю, функция НОРМ.РАСП вернёт ошибку #ДЕЛ/0!. Убедитесь, что σ > 0.

2. Построение графика плотности вероятности

Самый простой способ визуализировать распределение Гаусса — создать график плотности вероятности (PDF, Probability Density Function). Для этого потребуется:

  1. Сгенерировать массив значений X (например, от -3σ до +3σ с шагом 0.1).
  2. Рассчитать плотность вероятности для каждого X с помощью =НОРМ.РАСП(X; μ; σ; ЛОЖЬ).
  3. Построить график по двум столбцам: X (ось абсцисс) и Плотность (ось ординат).

Пример формул для μ=50 и σ=10:

=НОРМ.РАСП(A2; $E$1; $E$2; ЛОЖЬ)

где A2 — текущее значение X, а $E$1 и $E$2 — ячейки со средним и стандартным отклонением.

Создать столбец X с шагом 0.1–0.5|Задать правильные μ и σ в формуле|Использовать ЛОЖЬ для плотности вероятности|Выбрать точечную диаграмму с гладкими линиями-->

Для наглядности добавьте на график:

  • 🎨 Линию среднего (μ) вертикальной пунктирной линией.
  • 📌 Подписи осей: «Значение» (X) и «Плотность вероятности» (Y).
  • 🔍 Легенду с указанием параметров μ и σ.
ПараметрФормула ExcelПример значения
Среднее (μ)=СРЗНАЧ(диапазон)50
Стандартное отклонение (σ)=СТАНДОТКЛОН.В(диапазон)10
Массив X=ПОСЛЕДОВАТ(100; 1; μ-3σ; (6σ)/99)20, 20.2, 20.4, ..., 80
Плотность (PDF)=НОРМ.РАСП(X; μ; σ; ЛОЖЬ)0.0265

3. Функция распределения (CDF) и обратная функция

Помимо плотности вероятности, в анализе данных используется функция распределения (CDF, Cumulative Distribution Function), которая показывает вероятность того, что случайная величина примет значение меньше или равное X. В Excel для этого служит та же функция НОРМ.РАСП, но с четвёртым аргументом ИСТИНА:

=НОРМ.РАСП(X; μ; σ; ИСТИНА)

Обратная задача — найти значение X, соответствующее заданной вероятности — решается функцией НОРМ.ОБР:

=НОРМ.ОБР(вероятность; μ; σ)

Примеры применения:

  • 📊 Найти X, ниже которого лежит 95% данных: =НОРМ.ОБР(0,95; μ; σ).
  • 🔍 Проверить гипотезу: если X=60 при μ=50 и σ=10, то CDF = 0.8413 (84.13% данных ≤ 60).
⚠️ Внимание: Функция НОРМ.ОБР возвращает ошибку #ЧИСЛО!, если вероятность ≤ 0 или ≥ 1. Используйте =ЕСЛИОШИБКА() для обработки.

4. Динамическая модель с ползунками

Чтобы интерактивно изменять параметры распределения, добавьте в Excel элементы управления формы:

  1. Перейдите на вкладку РазработчикВставитьПолзунок (Элемент управления формы).
  2. Привяжите ползунок к ячейке со значением μ (например, $E$1).
  3. Настройте параметры ползунка: минимальное значение (0), максимальное (100), шаг (1).
  4. Повторите для σ (диапазон 1–30, шаг 0.5).

Теперь при перемещении ползунков график будет обновляться автоматически. Для удобства свяжите ползунок σ с формулой, ограничивающей минимальное значение:

=МАКС(0,1; E2)

где E2 — ячейка, связанная с ползунком.

5. Типичные ошибки и как их избежать

Даже опытные пользователи допускают ошибки при работе с нормальным распределением в Excel. Вот наиболее частые:

  • 🔢 Перепутаны аргументы в НОРМ.РАСП: вместо =НОРМ.РАСП(X; μ; σ; ЛОЖЬ) вводят =НОРМ.РАСП(μ; X; σ; ЛОЖЬ). Результат — неверная кривая.
  • 📉 Неправильный диапазон X: если шаг между значениями слишком большой (>1), график получится «зубчатым». Оптимальный шаг — 0.1–0.5.
  • 🔄 Использование СТАНДОТКЛОН.Г вместо СТАНДОТКЛОН.В: первая функция рассчитывает отклонение для генеральной совокупности, вторая — для выборки. Для большинства задач подходит СТАНДОТКЛОН.В.

Критическая ошибка: При копировании формулы НОРМ.РАСП вниз по столбцу не закрепляйте ячейки со средним и стандартным отклонением (например, $E$1). Если забыть про абсолютные ссылки, параметры сдвинутся, и каждая строка будет использовать разные μ и σ.

Плотность вероятности (PDF)|Функция распределения (CDF)|Обратная функция (НОРМ.ОБР)|Динамическая модель с ползунками-->

6. Практическое применение: анализ данных

Распределение Гаусса широко применяется для:

  • 📈 Контроля качества: определение допустимых отклонений в производственных процессах (например, диаметр деталей).
  • 🎯 Финансового моделирования: оценка рисков портфеля акций (модель Блэка-Шоулза).
  • 🧠 Психометрии: анализ результатов тестов (IQ, экзамены).
  • 🔬 Научных исследований: обработка экспериментальных данных (например, погрешности измерений).

Пример из практики: если вы анализируете время выполнения задачи 100 сотрудниками, нормальное распределение поможет:

  1. Определить, сколько сотрудников выполняют задачу быстрее среднего (μ - σ).
  2. Выявить выбросы (значения за пределами μ ± 3σ).
  3. Спрогнозировать время выполнения для новых сотрудников.
Как проверить, нормально ли распределены ваши данные?

Используйте тест Шапиро-Уилка или визуально сравните гистограмму с кривой Гаусса. В Excel для этого подходит надстройка Analysis ToolPak (Пакета анализа).

7. Альтернативы: другие распределения в Excel

Если нормальное распределение не подходит для ваших данных, рассмотрите альтернативы:

РаспределениеФункция ExcelКогда использовать
Стьюдента (t-распределение)СТЬЮДЕНТ.РАСПМалые выборки (n < 30)
ЭкспоненциальноеЭКСП.РАСПВремя между событиями (например, отказы оборудования)
БиномиальноеБИНОМ.РАСПДискретные данные (да/нет, успех/неудача)
ЛогнормальноеЛОГНОРМ.РАСПДанные с положительной асимметрией (доходы, размеры частиц)

Для выбора подходящего распределения используйте критерии согласия (например, хи-квадрат) или визуальный анализ гистограммы.

FAQ: Частые вопросы

Как построить график нормального распределения для своих данных?

1. Рассчитайте среднее (=СРЗНАЧ()) и стандартное отклонение (=СТАНДОТКЛОН.В()).

2. Сгенерируйте массив X от μ - 3σ до μ + 3σ с шагом 0.1.

3. Рассчитайте плотность вероятности для каждого X: =НОРМ.РАСП(X; μ; σ; ЛОЖЬ).

4. Постройте точечную диаграмму с гладкими линиями.

Почему моя кривая Гаусса получается асимметричной?

Вероятные причины:

  • Неверно указаны μ или σ в формуле.
  • Диапазон X смещён относительно μ (например, начинается не с μ - 3σ).
  • Исходные данные не являются нормально распределёнными (проверьте гистограмму).

Можно ли построить нормальное распределение без исходных данных?

Да. Задайте произвольные μ и σ (например, 0 и 1 для стандартного распределения), затем сгенерируйте массив X и рассчитайте плотность вероятности, как описано в разделе 2.

Как в Excel найти вероятность попадания в интервал?

Используйте разность функций распределения (CDF):

=НОРМ.РАСП(верхняя_граница; μ; σ; ИСТИНА) - НОРМ.РАСП(нижняя_граница; μ; σ; ИСТИНА)

Например, вероятность того, что значение попадёт между 40 и 60 при μ=50 и σ=10:

=НОРМ.РАСП(60; 50; 10; ИСТИНА) - НОРМ.РАСП(40; 50; 10; ИСТИНА)

Чем отличаются НОРМ.РАСП и НОРМ.СТ.РАСП?

НОРМ.СТ.РАСП — это частный случай НОРМ.РАСП для стандартного нормального распределения (μ=0, σ=1). Формулы эквивалентны:

НОРМ.РАСП(X; 0; 1; ЛОЖЬ) = НОРМ.СТ.РАСП(X)