Как рассчитать плотность распределения в Excel: подробное руководство с примерами

Плотность распределения — ключевое понятие в статистике, которое помогает оценить вероятность попадания случайной величины в определённый интервал. В Microsoft Excel расчёт этой метрики доступен даже без глубоких знаний математики: достаточно правильно применить встроенные функции и понять их логику. Но как не запутаться в формулах, если вы впервые сталкиваетесь с задачей? И почему результаты иногда кажутся нелогичными?

Эта статья разберёт пошаговый алгоритм расчёта плотности для нормального, экспоненциального и других типов распределений. Мы покажем, как избежать типичных ошибок (например, путаницы между функцией плотности и функцией распределения), и предоставим готовые шаблоны для копирования. А если вам нужно визуализировать результаты — научим строить графики плотности прямо в Excel.

Далее вы найдёте не только теорию, но и практические примеры с формулами, которые можно адаптировать под свои данные. Например, как рассчитать вероятность того, что время выполнения задачи уложится в 10–15 минут, если оно распределено нормально со средним 12 минут и стандартным отклонением 2 минуты. Готовы начать?

Что такое плотность распределения и зачем её считать

Плотность распределения (или плотность вероятности) — это функция, которая описывает, как вероятность «распределена» по возможным значениям случайной величины. В отличие от функции распределения (которая показывает вероятность того, что величина примет значение меньше или равное заданному), плотность отвечает на вопрос: «Какова вероятность попадания в малый интервал около точки x?».

Например, если вы анализируете рост студентов в группе, плотность распределения покажет, какие значения роста встречаются чаще (например, 170–175 см), а какие реже (150 см или 190 см). В Excel эту задачу решают с помощью специализированных функций:

  • 📊 НОРМ.РАСП — для нормального распределения (колоколообразная кривая).
  • ЭКСП.РАСП — для экспоненциального распределения (используется в задачах надёжности, времени ожидания).
  • 🎲 БЕТА.РАСП — для бета-распределения (применяется в байесовской статистике).

Почему это важно для бизнеса? Представьте, что вы владелец магазина и хотите спрогнозировать спрос на товар. Зная плотность распределения продаж по дням недели, вы сможете оптимизировать запасы и избежать перепроизводства или дефицита. Или другой случай: инженеры рассчитывают плотность распределения нагрузки на сервер, чтобы предотвратить сбои в часы пик.

Но здесь кроется подвох: многие путают плотность с вероятностью. Плотность в точке x — это не вероятность события x, а предел отношения вероятности попадания в малый интервал к длине этого интервала, когда его длина стремится к нулю. Например, вероятность того, что рост студента ровно 175 см, равна нулю (так как рост — непрерывная величина), но плотность в этой точке будет ненулевой.

Подготовка данных: что нужно знать до расчётов

Прежде чем приступать к формулам, убедитесь, что ваши данные соответствуют трём ключевым требованиям:

  1. Данные должны быть непрерывными (например, время, вес, температура). Для дискретных величин (количество продаж, число дефектов) используют другие методы.
  2. Необходимо знать тип распределения (нормальное, экспоненциальное и т. д.). Если тип неизвестен, его можно оценить с помощью гистограммы или тестов (например, критерий Шапиро-Уилка).
  3. Параметры распределения (среднее, стандартное отклонение, λ для экспоненциального) должны быть заранее рассчитаны или оценены.

Для примера возьмём нормальное распределение с параметрами:

  • Среднее (μ) = 10
  • Стандартное отклонение (σ) = 2

Нам нужно рассчитать плотность в точке x = 12.

В Excel это делается функцией:

=НОРМ.РАСП(12; 10; 2; ЛОЖЬ)

Где:

  • 12 — значение, для которого считаем плотность;
  • 10 — среднее;
  • 2 — стандартное отклонение;
  • ЛОЖЬ — флаг, указывающий, что нам нужна плотность, а не функция распределения.
📊 Какой тип распределения вы чаще всего анализируете?
Нормальное
Экспоненциальное
Равномерное
Другой
Не знаю

Если вы работаете с экспоненциальным распределением (например, время безотказной работы оборудования), используйте функцию ЭКСП.РАСП:

=ЭКСП.РАСП(5; 0,2; ЛОЖЬ)

Здесь 0,2 — это параметр λ (обратный среднему времени).

⚠️ Внимание: Если в формуле НОРМ.РАСП или ЭКСП.РАСП указать ИСТИНА вместо ЛОЖЬ, Excel вернёт не плотность, а кумулятивную функцию распределения (вероятность того, что значение будет меньше или равно x). Это частая ошибка новичков!

Пошаговая инструкция: расчёт плотности нормального распределения

Рассмотрим подробный алгоритм на примере нормального распределения. Предположим, у нас есть данные о весе упаковок продукта (в граммах), и мы хотим узнать плотность вероятности для веса 500 г.

Собрать выборку данных (минимум 30 значений)

Рассчитать среднее (=СРЗНАЧ)

Рассчитать стандартное отклонение (=СТАНДОТКЛОН)

Определить точку x, для которой нужна плотность

Выбрать функцию в Excel (НОРМ.РАСП, ЭКСП.РАСП и др.)

-->

Шаги:

  1. Соберем данные. Допустим, у нас есть 100 измерений веса упаковок. Среднее (μ) = 495 г, стандартное отклонение (σ) = 10 г.
  2. Введём параметры в Excel. В ячейках A1, A2, A3 укажем:
    • A1: 500 (значение x)
    • A2: 495 (среднее)
    • A3: 10 (стандартное отклонение)
  • Применим функцию. В ячейке A4 введём:
    =НОРМ.РАСП(A1; A2; A3; ЛОЖЬ)

    Результат: ~0,0352 (плотность в точке 500 г).

  • Интерпретируем результат. Это означает, что вероятность попадания веса в малый интервал вокруг 500 г пропорциональна 0,0352. Чем выше значение, тем чаще встречаются значения около 500 г.
  • Чтобы построить график плотности, выполните следующие действия:

    1. Создайте столбец с значениями x (например, от 460 до 530 с шагом 5).
    2. Рядом рассчитайте плотность для каждого x с помощью НОРМ.РАСП.
    3. Выделите оба столбца и вставьте точечную диаграмму с гладкими линиями.
    4. Расчёт плотности для других типов распределений

      Excel поддерживает не только нормальное распределение. Рассмотрим ещё три популярных типа:

      Тип распределения Функция в Excel Пример использования Параметры
      Экспоненциальное ЭКСП.РАСП Время между звонками в колл-центре x, λ (интенсивность)
      Равномерное РАВНОМЕРН.РАСП Результаты броска игрального кубика x, min, max
      Бета-распределение БЕТА.РАСП Доля времени, затраченного на задачу x, α, β, A, B
      Логнормальное ЛОГНОРМ.РАСП Доходы населения (часто асимметричны) x, μ, σ

      Пример для экспоненциального распределения:

      • Допустим, среднее время между отказами сервера — 50 часов. Тогда λ = 1/50 = 0,02.
      • Чтобы найти плотность в точке x = 20 часов, используем:
        =ЭКСП.РАСП(20; 0,02; ЛОЖЬ)

        Результат: ~0,0164.

      Для равномерного распределения (например, случайное число от 0 до 1):

      =РАВНОМЕРН.РАСП(0,5; 0; 1; ЛОЖЬ)

      Результат: 1 (плотность постоянна на всём интервале).

      ⚠️ Внимание: Функция БЕТА.РАСП в Excel 2010 и старше имеет синтаксис БЕТА.ОБР для обратной функции. В новых версиях (Excel 2016+) используйте БЕТА.РАСП с пятью параметрами: x, α, β, A (нижняя граница), B (верхняя граница).

      Типичные ошибки и как их избежать

      Даже опытные пользователи Excel иногда допускают ошибки при расчёте плотности. Вот самые распространённые из них:

      • 🔄 Путаница между плотностью и функцией распределения. Если в функции НОРМ.РАСП указать ИСТИНА вместо ЛОЖЬ, Excel вернёт не плотность, а вероятность P(X ≤ x). Всегда проверяйте последний аргумент!
      • 📏 Неправильные параметры распределения. Например, для экспоненциального распределения часто путают λ (интенсивность) со средним временем. Помните: λ = 1 / среднее.
      • 📉 Игнорирование масштаба данных. Если ваши данные измеряются в килограммах, а вы вводите их в граммах, параметры распределения тоже нужно пересчитать.
      • 🔍 Неверная интерпретация результатов. Плотность в точке — это не вероятность! Чтобы получить вероятность попадания в интервал, нужно интегрировать плотность (или использовать функцию распределения).

    Пример ошибки:

    =НОРМ.РАСП(10; 10; 2; ИСТИНА)

    Эта формула вернёт 0,5 (вероятность того, что X ≤ 10), а не плотность! Правильный вариант:

    =НОРМ.РАСП(10; 10; 2; ЛОЖЬ)

    Результат: ~0,1995 (плотность в точке x = 10).

    Ещё одна ловушка — округление данных. Если ваши исходные данные округлены (например, рост указан с точностью до сантиметра), это может искажать расчёты. В таких случаях используйте коррекцию на непрерывность (например, для интервала 170–175 см берите середину — 172,5 см).

    Как проверить, подходит ли нормальное распределение для ваших данных?

    1. Постройте гистограмму и визуально оцените симметричность.

    2. Используйте тест Шапиро-Уилка (в Excel его нет, но можно сделать в Python/R или онлайн-калькуляторах).

    3. Сравните среднее и медиану: если они близки, распределение скорее симметричное.

    4. Посчитайте коэффициент асимметрии: =СКОС. Значение близкое к 0 указывает на нормальное распределение.

    Визуализация плотности: как построить график в Excel

    График плотности помогает наглядно оценить форму распределения и выявить аномалии. Вот как его построить:

    1. Подготовьте данные. Создайте два столбца:
      • Столбец A: значения x (например, от μ - 3σ до μ + 3σ с шагом 0,5).
      • Столбец B: плотность для каждого x (используйте НОРМ.РАСП).
  • Постройте график. Выделите оба столбца → Вставка → Точечная с гладкими кривыми.
  • Настройте ось X. Кликните правой кнопкой по оси → Формат оси → установите минимальное и максимальное значения, соответствующие вашему диапазону x.
  • Добавьте заголовки. Укажите название графика (например, «Плотность распределения веса упаковок») и подписи осей.
  • Пример формул для столбца B (плотность):

    =НОРМ.РАСП(A2; $D$1; $D$2; ЛОЖЬ)

    Где $D$1 и $D$2 — ячейки со средним и стандартным отклонением.

    Для сравнения нескольких распределений на одном графике:

    1. Добавьте дополнительные столбцы с плотностями для других параметров (например, μ = 12, σ = 3).
    2. При построении графика выделите все столбцы с плотностями.
    3. Excel автоматически создаст легенду для каждого распределения.
    4. Продвинутые приёмы: интегрирование плотности и расчёт вероятностей

      Плотность сама по себе не даёт вероятность попадания в интервал — для этого нужно проинтегрировать функцию плотности по интервалу. В Excel это делается с помощью функции распределения (кумулятивной):

      Формула для вероятности P(a ≤ X ≤ b):

      =НОРМ.РАСП(b; μ; σ; ИСТИНА) - НОРМ.РАСП(a; μ; σ; ИСТИНА)

      Пример: найдём вероятность того, что вес упаковки попадёт в интервал 490–510 г (μ = 495, σ = 10):

      =НОРМ.РАСП(510; 495; 10; ИСТИНА) - НОРМ.РАСП(490; 495; 10; ИСТИНА)

      Результат: ~0,6827 (68,27%). Это соответствует правилу трёх сигм: ~68% данных попадают в интервал μ ± σ.

      Для несимметричных распределений (например, экспоненциального) принцип тот же:

      =ЭКСП.РАСП(20; 0,02; ИСТИНА) - ЭКСП.РАСП(10; 0,02; ИСТИНА)

      Эта формула вернёт вероятность того, что время безотказной работы придётся на интервал 10–20 часов.

      Если вам нужно найти квантиль (значение, ниже которого лежит заданная доля распределения), используйте обратные функции:

      • НОРМ.ОБР — для нормального распределения;
      • ЭКСП.ОБР — для экспоненциального;
      • БЕТА.ОБР — для бета-распределения.

      Пример: найдём значение, ниже которого лежит 95% нормального распределения (μ = 10, σ = 2):

      =НОРМ.ОБР(0,95; 10; 2)

      Результат: ~13,29.

      FAQ: Ответы на частые вопросы

      Можно ли рассчитать плотность для дискретных данных?

      Нет, плотность распределения определена только для непрерывных случайных величин. Для дискретных данных (например, количество продаж) используйте функцию вероятности (например, БИНОМ.РАСП для биномиального распределения).

      Почему моя плотность отрицательная?

      Плотность вероятности не может быть отрицательной! Если вы получили отрицательное значение, проверьте:

      • Правильность указания параметров (например, стандартное отклонение должно быть положительным).
      • Тип распределения (возможно, вы используете неподходящую функцию).
      • Флаг в конце формулы (должен быть ЛОЖЬ для плотности).

    Как рассчитать плотность для смешанных распределений?

    Excel не имеет встроенных функций для смесей распределений (например, суммы двух нормальных распределений). В этом случае:

    1. Рассчитайте плотности для каждого компонента отдельно.
    2. Умножьте каждую на вес компонента (долю в смеси).
    3. Сложите результаты. Например, если смесь состоит из 70% НОРМ.РАСП(μ1, σ1) и 30% НОРМ.РАСП(μ2, σ2):
      =0,7*НОРМ.РАСП(x; μ1; σ1; ЛОЖЬ) + 0,3*НОРМ.РАСП(x; μ2; σ2; ЛОЖЬ)

    Можно ли автоматизировать расчёт плотности для большого набора данных?

    Да! Используйте таблицы данных или Power Query:

    • Для таблиц данных: выделите ячейку с формулой плотности → Данные → Анализ «что-если» → Таблица данных.
    • Для Power Query: загрузите данные, добавьте пользовательский столбец с формулой плотности.

    Также можно написать простую макрос-функцию на VBA для расчётов.

    Как проверить, что мои данные действительно нормально распределены?

    Используйте комбинацию методов:

    1. Визуальный анализ: Постройте гистограмму и сравните с колоколообразной кривой.
    2. Статистические тесты: В Excel нет встроенных тестов (например, Шапиро-Уилка), но можно использовать надстройки (Analysis ToolPak) или внешние инструменты (Python, R).
    3. Правило 3 сигм: ~99,7% данных должны лежать в интервале μ ± 3σ.
    4. Коэффициенты асимметрии и эксцесса: Для нормального распределения асимметрия ≈ 0, эксцесс ≈ 3.
      =СКОС(диапазон_данных) → должно быть близко к 0
      

      =ЭКСЦЕСС(диапазон_данных) → должно быть близко к 3