Нормальное распределение в Excel: формулы, графики и практические примеры

Что такое нормальное распределение и зачем оно нужно в Excel

Нормальное распределение (или распределение Гаусса) — это фундаментальная концепция статистики, которая описывает, как значения некоторой величины распределяются вокруг среднего. В реальном мире оно встречается повсюду: от роста людей до ошибок измерений, от финансовых показателей до результатов тестов. В Microsoft Excel расчёт параметров нормального распределения упрощается благодаря встроенным функциям, но многие пользователи не знают, как ими правильно пользоваться.

Почему это важно для работы в Excel? Во-первых, нормальное распределение позволяет оценивать вероятности событий (например, "какова вероятность, что случайная величина окажется в диапазоне от X до Y?"). Во-вторых, оно лежит в основе многих статистических тестов, таких как t-критерий Стьюдента или ANOVA. Наконец, визуализация нормального распределения помогает наглядно представить данные и выявить аномалии.

В этой статье мы разберём:

  • 📊 Основные функции Excel для нормального распределения (НОРМ.РАСП, НОРМ.ОБР, НОРМ.СТ.РАСП)
  • 📈 Как построить график плотности вероятности и функцию распределения
  • 🔍 Примеры практического применения: контроль качества, финансовый анализ, обработка экспериментальных данных
  • ⚠️ Типичные ошибки и как их избежать
📊 Для чего вам нужно нормальное распределение в Excel?
Для академических исследований
Для бизнес-анализа
Для обработки экспериментальных данных
Просто из интереса
Другое

Основные функции Excel для нормального распределения

Excel предлагает несколько встроенных функций для работы с нормальным распределением. Их синтаксис и назначение отличаются, поэтому важно понимать, какую функцию использовать в каждом конкретном случае.

1. НОРМ.РАСП (NORM.DIST)

Эта функция возвращает значение плотности вероятности (если аргумент интегральная = ЛОЖЬ) или функции распределения (если интегральная = ИСТИНА). Синтаксис:

=НОРМ.РАСП(x; среднее; стандартное_откл; [интегральная])

Где:

  • x — значение, для которого вычисляется распределение;
  • среднее — математическое ожидание распределения;
  • стандартное_откл — стандартное отклонение;
  • интегральная — логическое значение (ИСТИНА или ЛОЖЬ).

2. НОРМ.ОБР (NORM.INV)

Обратная функция к НОРМ.РАСП с интегральная = ИСТИНА. Она возвращает значение x, для которого функция распределения равна заданной вероятности. Синтаксис:

=НОРМ.ОБР(вероятность; среднее; стандартное_откл)

Пример: если вам нужно найти значение, ниже которого лежит 95% всех данных, используйте =НОРМ.ОБР(0,95; среднее; стандартное_откл).

3. НОРМ.СТ.РАСП и НОРМ.СТ.ОБР

Эти функции работают с стандартным нормальным распределением (где среднее = 0, а стандартное отклонение = 1). Они полезны, когда вам нужно преобразовать данные в z-оценки или наоборот:

=НОРМ.СТ.РАСП(z)  // Плотность или функция распределения для стандартного нормального

=НОРМ.СТ.ОБР(вероятность) // Обратная функция

Построение графика нормального распределения в Excel

Визуализация нормального распределения помогает лучше понять, как данные распределены вокруг среднего. Для построения графика плотности вероятности выполните следующие шаги:

  1. Подготовьте данные для оси X: создайте столбец с значениями, охватывающими диапазон ваших данных (например, от среднее - 3*стандартное_откл до среднее + 3*стандартное_откл) с шагом 0,1–0,5.
  2. Рассчитайте плотность вероятности: используйте функцию НОРМ.РАСП с параметром интегральная = ЛОЖЬ для каждого значения X.
  3. Постройте график:
    • Выделите столбцы с значениями X и плотностью.
    • Перейдите на вкладку Вставка → Вставить график → Точечная с гладкими кривыми.
    • Добавьте оси и подписи для наглядности.

Пример формулы для расчёта плотности (если среднее = 10, стандартное отклонение = 2, а X находится в ячейке A2):

=НОРМ.РАСП(A2; 10; 2; ЛОЖЬ)

Создать диапазон значений X с шагом 0,1–0,5|Рассчитать плотность вероятности для каждого X|Выделить данные и вставить точечную диаграмму|Добавить название осей и легенду|Отформатировать кривую для наглядности-->

Для построения функции распределения (кумулятивной кривой) используйте тот же подход, но с параметром интегральная = ИСТИНА.

Практическое применение: примеры расчётов

Рассмотрим три реальных сценария, где нормальное распределение в Excel может быть полезно.

1. Контроль качества на производстве

Допустим, завод производит болты с номинальным диаметром 10 мм. Измерения показали, что средний диаметр составляет 10,1 мм со стандартным отклонением 0,2 мм. Вопрос: какой процент болтов будет иметь диаметр менее 9,8 мм (бракованные)?

Решение:

=НОРМ.РАСП(9,8; 10,1; 0,2; ИСТИНА)

Результат: ~6,68%. Это означает, что около 6,7% болтов окажутся бракованными.

2. Финансовый анализ: оценка рисков

Предположим, доходность портфеля акций в среднем составляет 8% годовых со стандартным отклонением 5%. Какова вероятность, что доходность в следующем году будет отрицательной?

Решение:

=НОРМ.РАСП(0; 8%; 5%; ИСТИНА)

Результат: ~21,19%. То есть риск убытков составляет примерно 21,2%.

3. Обработка экспериментальных данных

В научном эксперименте измерялась температура реакции. Среднее значение составило 25°C, стандартное отклонение — 1,5°C. Каков диапазон температур, в который попадёт 95% всех измерений?

Решение: используем НОРМ.ОБР для нахождения границ:

  • Нижняя граница: =НОРМ.ОБР(0,025; 25; 1,5) → ~22,07°C
  • Верхняя граница: =НОРМ.ОБР(0,975; 25; 1,5) → ~27,93°C
Почему именно 0,025 и 0,975?

Эти значения соответствуют 2,5% хвостам распределения с каждой стороны. Поскольку нормальное распределение симметрично, 95% данных лежат между этими квантилями (100% - 2,5% - 2,5% = 95%).

Сценарий Функция Excel Пример формулы Результат
Контроль качества (брак) НОРМ.РАСП =НОРМ.РАСП(9,8; 10,1; 0,2; ИСТИНА) 6,68%
Финансовые риски (убытки) НОРМ.РАСП =НОРМ.РАСП(0; 8%; 5%; ИСТИНА) 21,19%
Экспериментальные данные (95% диапазон) НОРМ.ОБР =НОРМ.ОБР(0,025; 25; 1,5) и =НОРМ.ОБР(0,975; 25; 1,5) 22,07°C – 27,93°C

Типичные ошибки и как их избежать

При работе с нормальным распределением в Excel пользователи часто допускают ошибки, которые искажают результаты. Вот наиболее распространённые из них:

⚠️ Внимание: Функция НОРМ.РАСП с параметром интегральная = ЛОЖЬ возвращает плотность вероятности, а не вероятность. Если вам нужна вероятность попадания в интервал, используйте интегральная = ИСТИНА или вычитайте значения функций распределения на границах интервала.

Ошибка 1: Путаница между плотностью и функцией распределения

Многие пользователи ожидают, что НОРМ.РАСП(x; среднее; стандартное_откл; ЛОЖЬ) вернёт вероятность, но на самом деле это значение плотности. Чтобы найти вероятность попадания в интервал [a; b], используйте:

=НОРМ.РАСП(b; среднее; стандартное_откл; ИСТИНА) - НОРМ.РАСП(a; среднее; стандартное_откл; ИСТИНА)

Ошибка 2: Неправильное стандартное отклонение

Excel предлагает две функции для расчёта стандартного отклонения: СТАНДОТКЛОН.В (для выборки) и СТАНДОТКЛОН.Г (для генеральной совокупности). Если вы анализируете всю совокупность данных, используйте СТАНДОТКЛОН.Г. Для выборки — СТАНДОТКЛОН.В.

Ошибка 3: Игнорирование выбросов

Нормальное распределение чувствительно к выбросам (экстремальным значениям). Если ваши данные содержат аномалии, результаты могут быть искажены. Перед анализом проверьте данные на выбросы с помощью:

  • 📉 Правила трёх сигм (значения за пределами среднее ± 3*стандартное_откл считаются выбросами).
  • 📊 Диаграммы размаха (box plot), которые можно построить с помощью надстройки Analysis ToolPak.

Продвинутые приёмы: z-оценки и стандартизация

Z-оценки (или стандартные оценки) показывают, на сколько стандартных отклонений значение отклоняется от среднего. Они полезны для сравнения данных из разных распределений. В Excel z-оценку можно рассчитать по формуле:

= (x - среднее) / стандартное_откл

или с помощью функции:

= СТАНДАРТИЗАЦИЯ(x; среднее; стандартное_откл)

Пример: Студент набрал 85 баллов по тесту, где средний балл — 70, а стандартное отклонение — 10. Его z-оценка:

= (85 - 70) / 10 = 1,5

Это означает, что его результат на 1,5 стандартных отклонения выше среднего.

Применение z-оценок:

  • 📚 Сравнение успеваемости студентов по разным предметам с разными шкалами оценок.
  • 📈 Выявление аномалий в финансовых данных (например, необычно высокие или низкие показатели).
  • 🔬 Нормализация данных перед применением некоторых статистических методов (например, регрессии).

Критическая информация: z-оценки позволяют преобразовать любое нормальное распределение в стандартное (со средним 0 и стандартным отклонением 1), что упрощает сравнение разных наборов данных.

Автоматизация с помощью Analysis ToolPak

Если вам нужно проводить сложный статистический анализ, включите надстройку Analysis ToolPak:

  1. Перейдите в Файл → Параметры → Надстройки.
  2. Внизу окна выберите Управление: Надстройки Excel → Перейти.
  3. Отметьте Пакет анализа и нажмите OK.

Теперь у вас появится инструмент Анализ данных на вкладке Данные. С его помощью можно:

  • 📊 Создавать гистограммы с наложенной кривой нормального распределения.
  • 🔢 Вычислять описательную статистику (среднее, дисперсию, асимметрию и т. д.).
  • 📈 Проводить регрессионный анализ и тесты гипотез.
Как построить гистограмму с кривой нормального распределения?

1. В Анализ данных выберите Гистограмма и укажите входной диапазон.

2. Постройте гистограмму.

3. Рассчитайте нормальное распределение для диапазона значений (как описано выше).

4. Добавьте кривую на график через Вставка → График → Точечная.

FAQ: Частые вопросы о нормальном распределении в Excel

Как проверить, нормально ли распределены мои данные?

Для проверки нормальности используйте:

  • Визуальные методы: постройте гистограмму и сравните её форму с колоколообразной кривой. Также можно использовать Q-Q plot (квантиль-квантильный график), где точки должны лежать на прямой линии, если распределение нормальное.
  • Статистические тесты:
    • Тест Шапиро-Уилка (для небольших выборок, n < 50).
    • Тест Колмогорова-Смирнова или Андерсона-Дарлинга (для больших выборок).

В Excel тест Шапиро-Уилка можно провести с помощью макроса или надстройки Real Statistics Resource Pack.

Чем отличаются функции НОРМ.РАСП и НОРМ.СТ.РАСП?

Основное отличие — в параметрах распределения:

  • НОРМ.РАСП работает с произвольным нормальным распределением (любые среднее и стандартное отклонение).
  • НОРМ.СТ.РАСП работает только со стандартным нормальным распределением (среднее = 0, стандартное отклонение = 1).

Пример: если вам нужно найти вероятность для z-оценки, используйте НОРМ.СТ.РАСП. Для исходных данных — НОРМ.РАСП.

Как рассчитать доверительный интервал для среднего?

Доверительный интервал для среднего при известном стандартном отклонении рассчитывается по формуле:

= среднее ± z * (стандартное_откл / КОРЕНЬ(n))

Где:

  • z — квантиль стандартного нормального распределения (например, 1,96 для 95% доверительного интервала);
  • n — размер выборки.

Пример для 95% доверительного интервала (среднее = 50, стандартное отклонение = 5, n = 100):

= 50 ± 1,96 * (5 / КОРЕНЬ(100)) → [49,02; 50,98]
Можно ли использовать нормальное распределение для небольших выборок?

Нормальное распределение лучше всего работает с большими выборками (обычно n > 30). Для небольших выборок (n < 30) используйте t-распределение Стьюдента, которое учитывает дополнительную неопределённость. В Excel для этого есть функции СТЬЮДЕНТ.РАСП и СТЬЮДЕНТ.ОБР.

Пример: для расчёта доверительного интервала при n = 20 используйте:

= среднее ± СТЬЮДЕНТ.ОБР(0,05; 19) * (стандартное_откл / КОРЕНЬ(20))
Как построить кривую нормального распределения поверх гистограммы?

Алгоритм:

  1. Постройте гистограмму с помощью Анализ данных → Гистограмма.
  2. Рассчитайте нормальное распределение для диапазона значений X (как описано в разделе про графики).
  3. Добавьте на график вторичную ось:
    • Щёлкните правой кнопкой по гистограмме → Выбрать данные.
    • Добавьте новый ряд с рассчитанными значениями плотности.
    • Измените тип графика для нового ряда на График с маркерами.