Диаграмма распределения в Excel: как построить и настроить за 5 шагов

Диаграммы распределения — это мощный инструмент визуализации данных, который помогает быстро оценить, как значения распределены в наборе. В Microsoft Excel их можно построить несколькими способами: от простых гистограмм до сложных графиков плотности. Но многие пользователи сталкиваются с проблемами: неправильно выбранный тип диаграммы искажает данные, а неверные настройки осей делают график нечитаемым.

В этой статье вы найдёте пошаговые инструкции для создания диаграмм распределения в разных версиях Excel (2016–2023, Office 365), включая скрытые функции анализа данных, которые экономят часы ручной работы. Мы разберём не только базовые настройки, но и продвинутые приёмы — например, как автоматически подобрать оптимальное количество интервалов («бин») для гистограммы или добавить линию нормального распределения для сравнения.

Неважно, анализируете ли вы продажи, результаты опросов или научные данные — после прочтения вы сможете построить профессиональную диаграмму распределения, которая точно отразит особенности вашего датасета.

Что такое диаграмма распределения и зачем она нужна

Диаграмма распределения показывает, как часто встречаются те или иные значения в наборе данных. Например, если вы анализируете рост студентов в классе, такой график наглядно продемонстрирует, какой рост самый распространённый, а какой — редкость.

Основные типы диаграмм распределения в Excel:

  • 📊 Гистограмма — классический вариант с столбцами, где высота каждого столбца соответствует частоте попадания значений в интервал («бин»).
  • 🌊 График плотности — сглаженная кривая, которая показывает распределение вероятностей (требует надстройки Analysis ToolPak).
  • 📈 Ящичная диаграмма (Box Plot) — отображает медиану, квартили и выбросы (доступна в Excel 2016+).
  • 🔄 Накопленная частота — показывает, сколько значений не превышает определённого порога (полезно для анализа процентилей).

Где применяются такие диаграммы?

  • 📉 Статистика: анализ выборок, проверка гипотез (например, соответствует ли распределение нормальному закону).
  • 💰 Финансы: распределение доходов клиентов, частотный анализ транзакций.
  • 🔬 Наука: обработка экспериментальных данных (например, распределение ошибок измерений).
  • 📊 Маркетинг: сегментация аудитории по возрасту, доходу или другим параметрам.
⚠️ Внимание: Если ваши данные содержат выбросы (значения, сильно отличающиеся от большинства), гистограмма может получиться искажённой. В таком случае лучше использовать ящичную диаграмму или предварительно очистить данные от аномалий.
📊 Какой тип диаграммы распределения вы используете чаще?
Гистограмма
График плотности
Ящичная диаграмма
Накопленная частота
Не строил(а) такие диаграммы

Подготовка данных: 5 правил для точной диаграммы

Перед тем как строить диаграмму, данные нужно правильно подготовить. Ошибки на этом этапе приведут к некорректному графику, который исказит реальную картину. Вот ключевые правила:

  1. Удалите пустые ячейки и текстовые значения. Гистограмма строятся только по числовым данным. Если в столбце есть текст (например, «Н/Д»), Excel проигнорирует такие строки или выдаст ошибку.
  2. Отсортируйте данные по возрастанию. Это поможет визуально оценить распределение ещё до построения графика и выявить аномалии.
  3. Определите разумные границы интервалов («бинов»). Слишком широкие интервалы скроют детали, а слишком узкие сделают график хаотичным. Оптимальное число интервалов можно рассчитать по формуле Стерджеса:
    Количество интервалов = 1 + 3,322 * log10(N)

    где N — количество наблюдений.

  4. Проверьте данные на выбросы. Значения, которые сильно выбиваются из общего ряда, могут исказить график. Используйте функцию =КВАРТИЛЬ() для их выявления.
  5. Разделите данные на группы (если нужно). Например, если вы анализируете распределение зарплат по отделам, лучше построить отдельные гистограммы для каждого отдела.
Тип данных Пример Рекомендации по подготовке
Непрерывные Рост, вес, температура Используйте 5–20 интервалов. Проверьте нормальность распределения с помощью Analysis ToolPak.
Дискретные Оценки (2, 3, 4, 5), количество продаж Интервалы не нужны — стройте график по уникальным значениям. Добавьте подписи данных.
Категориальные Цвета, модели телефонов Гистограмма не подходит — используйте столбчатую диаграмму или круговую.
Дата/время Дани продаж по дням Преобразуйте в числовой формат (например, количество дней с начала года) или группируйте по периодам.
⚠️ Внимание: Если ваши данные содержат отрицательные значения, стандартная гистограмма в Excel может отобразить их некорректно. В таком случае используйте график с накоплением или предварительно сдвиньте все значения в положительную область (например, прибавьте константу).

Удалить текстовые и пустые ячейки|

Отсортировать данные по возрастанию|

Рассчитать оптимальное количество интервалов|

Проверить данные на выбросы|

Разделить данные на группы (при необходимости)-->

Как построить гистограмму распределения в Excel: пошаговая инструкция

Гистограмма — самый популярный тип диаграммы распределения. В Excel её можно создать двумя способами: с помощью встроенного инструмента Гистограмма (Excel 2016+) или через надстройку Analysis ToolPak (подходит для старых версий). Разберём оба метода.

Способ 1: Встроенная гистограмма (Excel 2016 и новее)

Этот метод самый простой и не требует дополнительных надстроек. Подходит для быстрого анализа.

  1. Выделите ячейки с данными (например, столбец A2:A100).
  2. Перейдите на вкладку ВставкаВставить статистическую диаграмму (в группе Диаграммы) → выберите Гистограмма.
  3. Excel автоматически разобьёт данные на интервалы и построит график. Чтобы изменить количество интервалов:
    • Кликните правой кнопкой по оси X.
    • Выберите Формат оси.
    • В разделе Параметры оси укажите нужное количество интервалов (например, 10).
  • Добавьте подписи данных: кликните по столбцам → Добавить элементы диаграммыПодписи данных.
  • Преимущества этого метода:

    • ⚡ Быстрота — диаграмма строится за 2 клика.
    • 🔄 Автоматическое обновление при изменении исходных данных.

    Недостатки:

    • ❌ Нет гибкости в настройке интервалов (например, нельзя задать фиксированную ширину «бина»).
    • ❌ Нет возможности добавить линию нормального распределения.

    Способ 2: Гистограмма через Analysis ToolPak (для продвинутых)

    Этот метод даёт больше контроля над диаграммой, но требует активации надстройки Analysis ToolPak.

    1. Активируйте надстройку:
      • Перейдите в Файл → Параметры → Надстройки.
      • Внизу выберите Управление: Надстройки ExcelПерейти.
      • Отметьте Analysis ToolPak и нажмите OK.
    2. Подготовьте данные:
      • В столбце A — исходные данные (например, A2:A100).
      • В столбце B — границы интервалов (например, 0, 10, 20, 30, ...).
  • Перейдите на вкладку ДанныеАнализ данныхГистограмма.
  • В открывшемся окне:
    • Входной интервал: укажите диапазон с данными (например, $A$2:$A$100).
    • Интервал карманов: укажите диапазон с границами интервалов (например, $B$2:$B$10).
    • Отметьте Вывод графика и Интегральный процент (если нужна накопленная частота).
    • Нажмите OK. Excel создаст новую таблицу с расчётами и построит гистограмму.

    Преимущества Analysis ToolPak:

    • 🎯 Точный контроль над интервалами (можно задать фиксированную ширину).
    • 📊 Дополнительные статистики: накопленная частота, процентили.
    • 🔄 Возможность добавить линию нормального распределения вручную.

    Настройка гистограммы: как сделать её профессиональной

    Сырая гистограмма, построенная по умолчанию, часто выглядит неудобочитаемой. Вот как её улучшить:

    1. Оптимизация интервалов («бинов»)

    Число интервалов сильно влияет на восприятие графика:

    • 🔍 Слишком мало интервалов — график теряет детали (например, 3–4 столбца для 1000 значений).
    • 🌪️ Слишком много интервалов — график становится «зашумлённым» (например, 50 столбцов для 100 значений).

    Как выбрать оптимальное количество?

    • 📏 Формула Стерджеса (см. выше) — подходит для большинства случаев.
    • 🎯 Правило Фридмана-Диакониса: Количество интервалов = 2 * (кубический корень из N).
    • 👁️ Визуальный метод: изменяйте количество интервалов, пока график не станет наглядным.

    2. Добавление линии нормального распределения

    Если ваши данные должны подчиняться нормальному закону (например, рост людей, ошибки измерений), полезно наложить на гистограмму кривую нормального распределения. Для этого:

    1. Рассчитайте среднее (=СРЗНАЧ()) и стандартное отклонение (=СТАНДОТКЛОН()) ваших данных.
    2. Создайте столбец с значениями X (от среднее - 3*стандартное отклонение до среднее + 3*стандартное отклонение с шагом 0,1).
    3. Рассчитайте значения нормальной плотности для каждого X с помощью функции:
      =НОРМ.РАСП(X; среднее; стандартное_отклонение; ЛОЖЬ)
    4. Добавьте на график новую серию данных с рассчитанными значениями плотности (тип графика — График с маркерами).

    3. Оформление для презентации

    Чтобы гистограмма выглядела профессионально:

    • 🎨 Уберите фон: кликните по области диаграммы → Формат области диаграммыЗаливка: Нет заливки.
    • 📏 Настройте оси:
      • Горизонтальная ось (X): укажите понятные названия интервалов (например, «10–20», «20–30»).
      • Вертикальная ось (Y): если данные в процентах, добавьте подпись «Частота, %».
    • 🔤 Добавьте подписи:
      • Заголовок диаграммы (например, «Распределение возраста клиентов»).
      • Подписи данных на столбцах (если значения важны).
    • 🖼️ Цвета: используйте контрастные цвета для столбцов и линии распределения (например, синие столбцы + красная линия).
    Как добавить вторую ось Y для накопленной частоты?

    Чтобы показать накопленную частоту на той же диаграмме:

    1. Постройте гистограмму стандартным способом.

    2. Добавьте новую серию данных с накопленными значениями (используйте функцию =ЧАСТОТА() с параметром 1 для накопления).

    3. Кликните правой кнопкой по новой серии → Изменить тип диаграммы → выберите График.

    4. Кликните правой кнопкой по новой оси Y → Формат оси → установите Максимум = 1 (если частота в долях) или 100 (если в процентах).

    График плотности: альтернатива гистограмме

    Если ваши данные непрерывные (например, рост, вес, температура), вместо гистограммы можно построить график плотности — сглаженную кривую, которая показывает распределение вероятностей. Это особенно полезно для больших выборок (1000+ значений), где гистограмма получается слишком «рваной».

    Для построения графика плотности в Excel:

    1. Убедитесь, что активирована надстройка Analysis ToolPak (см. выше).
    2. Подготовьте данные:
      • Столбец A: исходные данные (например, A2:A500).
      • Столбец B: значения X для построения кривой (от минимума до максимума с шагом 0,1–1).
    3. Рассчитайте плотность для каждого X с помощью функции:
      =НОРМ.РАСП(B2; СРЗНАЧ(A:A); СТАНДОТКЛОН(A:A); ЛОЖЬ)
    4. Постройте график:
      • Выделите столбцы B (значения X) и C (плотность).
      • Перейдите на вкладку ВставкаВставить графикГрафик с маркерами.
  • Настройте график:
    • Уберите маркеры, оставив только сглаженную линию.
    • Добавьте подпись оси Y: «Плотность вероятности».

    Преимущества графика плотности:

    • 🌊 Показывает непрерывное распределение, а не дискретные интервалы.
    • 🔍 Позволяет сравнивать несколько распределений на одном графике (например, распределение роста мужчин и женщин).
    • 📊 Легче интерпретировать многомодальные распределения (с несколькими пиками).
    ⚠️ Внимание: График плотности не показывает реальные частоты — он отображает плотность вероятности. Чтобы получить реальное количество наблюдений в интервале, нужно умножить плотность на ширину интервала и общее число наблюдений.

    Ящичная диаграмма (Box Plot) в Excel: как построить и читать

    Ящичная диаграмма (Box Plot) — это компактный способ показать распределение данных через пять ключевых статистик:

    • 📦 Минимум (без выбросов).
    • 🟥 Первый квартиль (Q1) — 25-й процентиль.
    • 🟩 Медиана (Q2) — 50-й процентиль.
    • 🟨 Третий квартиль (Q3) — 75-й процентиль.
    • 📦 Максимум (без выбросов).
    • Выбросы — значения за пределами Q1 - 1.5*(Q3-Q1) и Q3 + 1.5*(Q3-Q1).

    В Excel 2016+ ящичную диаграмму можно построить вручную или с помощью надстройки. Разберём оба способа.

    Способ 1: Вручную (универсальный метод)

    1. Рассчитайте ключевые статистики:
      =КВАРТИЛЬ.ВКЛ(диапазон; 0)  // Минимум
      

      =КВАРТИЛЬ.ВКЛ(диапазон; 1) // Q1

      =КВАРТИЛЬ.ВКЛ(диапазон; 2) // Медиана

      =КВАРТИЛЬ.ВКЛ(диапазон; 3) // Q3

      =КВАРТИЛЬ.ВКЛ(диапазон; 4) // Максимум

    2. Рассчитайте границы для выбросов:
      =Q1 - 1.5*(Q3-Q1)  // Нижняя граница
      

      =Q3 + 1.5*(Q3-Q1) // Верхняя граница

    3. Постройте диаграмму с областями:
      • Создайте таблицу с данными для «ящика» (Q1, медиана, Q3) и «усов» (минимум, максимум).
      • Выделите данные и вставьте Диаграмму с областями (вкладка Вставка).
      • Отформатируйте диаграмму, чтобы она выглядела как классический Box Plot.
  • Добавьте выбросы вручную с помощью точечной диаграммы.
  • Способ 2: С помощью надстройки Box Plot (Excel 2016+)

    Если у вас Excel 2016 или новее, можно использовать встроенную функцию:

    1. Выделите данные (один столбец).
    2. Перейдите на вкладку ВставкаВставить статистическую диаграммуЯщик с усами.
    3. Excel автоматически рассчитает квартили и построит диаграмму.
    4. Как читать Box Plot?

      • 🔍 Длина «ящика» (от Q1 до Q3) показывает межквартильный размах — чем он больше, тем сильнее разбросаны данные.
      • 🎯 Положение медианы внутри «ящика»:
        • Если медиана ближе к Q1 — данные смещены вправо.
        • Если ближе к Q3 — смещены влево.
        • Если посередине — распределение симметричное.
      • Выбросы — точки за пределами «усов». Их наличие может говорить об ошибках в данных или необычных явлениях.
      Как сравнить несколько Box Plot на одной диаграмме?

      Чтобы сравнить распределения нескольких групп (например, продажи по регионам):

      1. Подготовьте данные в виде таблицы, где каждый столбец — отдельная группа.

      2. Постройте Ящичную диаграмму для каждого столбца на одном графике.

      3. Используйте разные цвета для каждой группы.

      4. Добавьте легенду и подписи осей для ясности.

      Это поможет быстро сравнить медианы, размахи и выбросы между группами.

      Типичные ошибки и как их избежать

      Даже опытные пользователи Excel допускают ошибки при построении диаграмм распределения. Вот самые распространённые из них и способы их исправления:

      Ошибка Причина Как исправить
      Гистограмма «рваная» (много пустых интервалов) Слишком много интервалов для малого объёма данных. Уменьшите количество интервалов или используйте график плотности.
      Столбцы гистограммы разной ширины Неверно заданы границы интервалов. Используйте интервалы одинаковой ширины (например, 0–10, 10–20, ...).
      График плотности «обрезан» по краям Диапазон значений X слишком узкий. Расширьте диапазон X до среднее ± 3*стандартное отклонение.
      Box Plot показывает неверные квартили Использована функция КВАРТИЛЬ.ИСКЛ вместо КВАРТИЛЬ.ВКЛ. Замените =КВАРТИЛЬ.ИСКЛ() на =КВАРТИЛЬ.ВКЛ().
      Диаграмма не обновляется при изменении данных Диапазон данных зафиксирован абсолютными ссылками ($A$1:$A$100). Используйте динамические диапазоны или таблицы Excel (Ctrl+T).

      Другие распространённые проблемы:

      • 📉 Искажённая шкала оси Y: Если ось Y начинается не с нуля, визуально искажаются пропорции столбцов. Решение: кликните по оси → Формат оси → установите Минимум = 0.
      • 🔢 Неверные подписи интервалов: Например, интервал «10–20» подписан как «10». Решение: отформатируйте подписи осей вручную.
      • 🎨 Слишком яркие цвета: Пестрые диаграммы сложно воспринимать. Решение: используйте пастельные тона или корпоративные цвета.
    ⚠️ Внимание: Если вы строите диаграмму распределения для категориальных данных (например, модели телефонов), гистограмма будет бессмысленной — используйте столбчатую диаграмму или круговую.

    Продвинутые приёмы: автоматизация и анализ

    Если вы регулярно работаете с диаграммами распределения, полезно знать эти приёмы для экономии времени и углублённого анализа:

    1. Динамические диаграммы с помощью таблиц Excel

    Чтобы диаграмма автоматически обновлялась при добавлении новых данных:

    1. Преобразуйте ваш диапазон в Таблицу Excel (Ctrl+T).
    2. Постройте диаграмму на основе таблицы. Теперь при добавлении строк диаграмма будет расширяться автоматически.

    2. Сравнение нескольких распределений на одном графике

    Чтобы сравнить, например, распределение зарплат в разных отделах:

    • 📊 Гистограмма: постройте гистограммы для каждого отдела на одном графике, используя разные цвета.
    • 🌊 График плотности: наложите несколько кривых плотности на одну диаграмму.
    • 📦 Box Plot: сравните медианы и размахи нескольких групп.

    3. Тест на нормальность распределения

    Чтобы проверить, соответствует ли ваше распределение нормальному закону:

    • 📏 Используйте Analysis ToolPak:
      • Перейдите в Данные → Анализ данных → Описательная статистика.
      • Отметьте опцию Итоговая статистика и Уров