Как построить многоугольник распределения в Excel: полное руководство с примерами

Многоугольник распределения — это графическое представление частотного распределения данных, которое помогает визуализировать тенденции и закономерности в числовых наборах. В отличие от гистограммы, где данные отображаются столбиками, многоугольник использует линии, соединяющие точки на графике. Такой формат особенно полезен для сравнения нескольких распределений на одном графике или анализа непрерывных данных.

В Microsoft Excel построение многоугольника распределения не требует сложных манипуляций, но имеет свои нюансы. Например, стандартные типы диаграмм не включают готовый шаблон для такого графика, поэтому его создают на основе точечной или линейной диаграммы с предварительной подготовкой данных. В этой статье мы разберём процесс от А до Я: от структурирования исходных данных до финальной настройки осей и легенды.

Если вы работаете с большими массивами статистических данных, многоугольник распределения станет незаменимым инструментом. Он позволяет быстро оценить форму распределения (симметричность, скошенность), выявить выбросы или сравнить несколько выборок. Например, в маркетинге такой график помогает анализировать распределение возрастов клиентов, а в производстве — контролировать отклонения параметров продукции.

Важно понимать, что многоугольник распределения — это не просто "красивая картинка", а аналитический инструмент. Его корректное построение требует внимания к деталям: выбору интервалов, масштабированию осей и даже цветовой гамме (чтобы не искажать восприятие). Далее мы рассмотрим каждый этап подробно, с учётом типичных ошибок и способов их избежать.

Что такое многоугольник распределения и когда его использовать

Многоугольник распределения (или полигон частот) — это ломаная линия, соединяющая точки, которые соответствуют серединам интервалов и частотам (или относительным частотам) попадания данных в эти интервалы. В отличие от гистограммы, он подчёркивает форму распределения, а не абсолютные значения частот.

Основные случаи применения:

  • 📊 Сравнение нескольких распределений на одном графике (например, продажи по регионам за разные годы).
  • 🔍 Анализ формы распределения: симметричность, мода, скошенность.
  • 📉 Визуализация трендов в временных рядах или непрерывных данных.
  • 🧪 Статистический контроль качества (например, распределение дефектов в партии).

Главное преимущество многоугольника перед гистограммой — возможность наложения нескольких графиков без визуального "зашумления". Например, если вам нужно сравнить распределение зарплат в двух отделах компании, многоугольники покажут различия чётче, чем столбцы гистограммы.

Однако у этого типа графика есть и ограничения:

  • ⚠️ Он не показывает плотность распределения так же наглядно, как гистограмма.
  • ⚠️ При малом количестве интервалов линия может искажать реальную форму распределения.
  • ⚠️ Требует предварительной группировки данных по интервалам.
📊 Для чего вы чаще всего используете графики в Excel?
Анализ данных
Отчёты для руководства
Научные исследования
Учёба
Другое

Подготовка данных: группировка и расчёт частот

Прежде чем строить многоугольник, необходимо подготовить исходные данные. Если у вас есть необработанный массив чисел (например, рост студентов или время выполнения задач), выполните следующие шаги:

1. Определите количество интервалов. Оптимальное число можно рассчитать по формуле Стерджесса:

k = 1 + 3.322 * log(n)

где n — количество наблюдений. Например, для 100 значений: k ≈ 7–8 интервалов.

2. Рассчитайте ширину интервала:

ширина = (максимум – минимум) / k

Округлите результат до удобного значения (например, 5 или 10).

3. Создайте таблицу с границами интервалов и частотами. Пример для данных о росте (см. таблицу ниже):

Интервал роста (см)Середина интервалаЧастота
150–159154.55
160–169164.512
170–179174.520
180–189184.58

Для автоматической группировки в Excel используйте функцию =ЧАСТОТА() (в английской версии — FREQUENCY). Например:

=ЧАСТОТА(A2:A101; B2:B9)

где A2:A101 — исходные данные, а B2:B9 — верхние границы интервалов.

Определить количество интервалов по формуле Стерджесса

Рассчитать ширину интервала и округлить

Создать столбец с серединами интервалов

Подсчитать частоты с помощью функции ЧАСТОТА()

Добавить "нулевые" точки до и после крайних интервалов (для замкнутой линии)-->

Построение многоугольника: пошаговая инструкция

Когда данные готовы, переходите к созданию графика. В Excel нет отдельного типа диаграммы "многоугольник распределения", поэтому мы будем использовать точечную диаграмму с линиями.

Шаг 1. Выделите столбцы с серединами интервалов и частотами (в нашем примере — это столбцы B и C).

Шаг 2. Перейдите на вкладку ВставкаВставить точечную (X,Y) или пузырьковую диаграмму → выберите Точечная с прямыми отрезками и маркерами.

Шаг 3. У вас появится график, но он ещё не выглядит как многоугольник. Чтобы замкнуть линию по краям, добавьте в таблицу данные два дополнительных ряда:

  • 🔹 До первого интервала: середина = (минимум данных – ширина интервала), частота = 0.
  • 🔹 После последнего интервала: середина = (максимум данных + ширина интервала), частота = 0.

Пример для нашего случая:

Середина интервалаЧастота
144.50
154.55
164.512
174.520
184.58
194.50

Обновите данные диаграммы (кликните правой кнопкой по графику → Выбрать данные → добавьте новые ряды).

Настройка осей и внешнего вида графика

По умолчанию Excel может неправильно масштабировать оси или использовать неудобные метки. Исправляем это:

1. Ось X (середины интервалов):

  • 📏 Установите минимальное и максимальное значения, соответствующие вашим данным (например, от 140 до 195 для роста).
  • 🔢 Задайте цену основных делений равной ширине интервала (например, 10 см).

2. Ось Y (частоты):

  • 📈 Начните ось с 0, чтобы избежать искажения восприятия.
  • 🔢 Установите шаг делений, кратный максимальной частоте (например, если максимум = 20, шаг = 5).

3. Линия графика:

  • 🎨 Измените цвет и толщину линии (вкладка Формат ряда данных).
  • 🔄 Уберите маркеры точек, если они мешают восприятию (или оставьте только для ключевых точек).

4. Дополнительные элементы:

  • 🏷️ Добавьте название графика (например, "Распределение роста студентов").
  • 📌 Подпишите оси: "Рост, см" (X) и "Частота" (Y).
  • 📊 Если сравниваете несколько распределений, добавьте легенду.
Как добавить вторую линию для сравнения?

1. Подготовьте данные для второго распределения в отдельных столбцах.

2. Кликните правой кнопкой по графику → "Выбрать данные" → "Добавить ряд".

3. Укажите диапазоны для середины интервалов (X) и частот (Y) второго распределения.

4. Настройте цвет линии во вкладке "Формат ряда данных".

Пример корректно оформленного многоугольника: Пример многоугольника распределения в Excel с подписанными осями и легендой

Типичные ошибки и как их избежать

Даже опытные пользователи Excel иногда допускают ошибки при построении многоугольников. Вот самые распространённые:

1. Неправильный выбор интервалов.

⚠️ Внимание: Слишком широкие интервалы сгладят важные детали распределения, а слишком узкие — сделают график "рваным". Используйте формулу Стерджесса или правило "корень из n" для определения оптимального количества.

2. Отсутствие "нулевых" точек.

Если не добавить точки с частотой 0 до первого и после последнего интервала, линия не замкнётся по краям, и график будет выглядеть как незавершённый.

3. Несогласованные оси.

Например, если по оси X указаны границы интервалов, а не их середины, линия сместится относительно реальных данных. Всегда используйте середины интервалов для оси X.

4. Искажение масштаба.

⚠️ Внимание: Если ось Y не начинается с нуля, визуально различия между частотами будут преувеличены. Например, разница между 18 и 20 покажется огромной, хотя на самом деле это всего 10%.

5. Перегруженность графиками.

Не стоит накладывать на один многоугольник более 3–4 распределений — это сделает его нечитаемым. Для сравнения большого числа выборок используйте малые множественные графики (small multiples).

Продвинутые возможности: наложение гистограммы и многоугольника

Для более глубокого анализа можно совместить гистограмму и многоугольник на одном графике. Это позволит увидеть и плотность распределения (столбцы), и его форму (линия).

Как это сделать:

  1. Постройте гистограмму на основе ваших данных (вкладка ВставкаГистограмма).
  2. Добавьте линию тренда (кликните по гистограмме → Добавить элемент диаграммыЛиния тренда).
  3. Настройте прозрачность столбцов (50–70%), чтобы линия была хорошо видна.
  4. Отключите отображение линии тренда как таковой и замените её на многоугольник, добавив ряд с частотами (как описано выше).

Пример комбинированного графика: Гистограмма с наложенным многоугольником распределения

Такой подход особенно полезен для:

  • 🔬 Визуализации плотности и формы одновременно.
  • 📊 Презентаций, где нужно показать и детали, и общую тенденцию.
  • 🧮 Проверки нормальности распределения (сравнение с колоколообразной кривой).

Автоматизация построения с помощью VBA

Если вам часто приходится строить многоугольники распределения, можно автоматизировать процесс с помощью макроса. Ниже приведён пример кода, который:

  • 🤖 Группирует данные по интервалам.
  • 📊 Строит многоугольник.
  • 🎨 Настраивает базовые параметры осей.

Скопируйте этот код в редактор VBA (Alt + F11):

Sub BuildFrequencyPolygon()

Dim ws As Worksheet

Dim dataRange As Range, freqRange As Range

Dim chartObj As ChartObject

Dim binCount As Integer, i As Integer

Dim minVal As Double, maxVal As Double, binWidth As Double

' Настройки (измените под свои данные)

Set ws = ActiveSheet

Set dataRange = ws.Range("A2:A101") ' Диапазон исходных данных

binCount = WorksheetFunction.RoundUp(1 + 3.322 * Log(worksheetfunction.Count(dataRange)), 0) ' Формула Стерджесса

' Рассчёт интервалов

minVal = worksheetfunction.Min(dataRange)

maxVal = worksheetfunction.Max(dataRange)

binWidth = (maxVal - minVal) / binCount

' Создание таблицы частот

ReDim bins(1 To binCount + 1, 1 To 3)

For i = 1 To binCount + 1

bins(i, 1) = minVal + (i - 1) * binWidth ' Нижняя граница

bins(i, 2) = minVal + (i - 0.5) * binWidth ' Середина

bins(i, 3) = worksheetfunction.Frequency(dataRange, ws.Range("B2:B" & binCount + 1))(i) ' Частота

Next i

' Вывод данных на лист (для проверки)

ws.Range("D2:F" & binCount + 2).Value = bins

' Построение графика

Set chartObj = ws.ChartObjects.Add(Left:=100, Width:=600, Top:=50, Height:=400)

With chartObj.Chart

.ChartType = xlXYScatterLines ' Точечная с линиями

.SeriesCollection.NewSeries

With .SeriesCollection(1)

.XValues = ws.Range("E2:E" & binCount + 2) ' Середины интервалов

.Values = ws.Range("F2:F" & binCount + 2) ' Частоты

.Name = "Многоугольник распределения"

End With

.Axes(xlCategory).MinimumScale = minVal - binWidth

.Axes(xlCategory).MaximumScale = maxVal + binWidth

.HasTitle = True

.ChartTitle.Text = "Многоугольник распределения"

End With

End Sub

Чтобы запустить макрос:

  1. Нажмите Alt + F8, выберите BuildFrequencyPolygon.
  2. Укажите диапазон с исходными данными в коде (строка Set dataRange).
  3. Запустите макрос — он автоматически создаст график и таблицу частот.

Преимущества автоматизации:

  • Экономия времени при работе с большими массивами.
  • 🔄 Стандартизация графиков (один стиль для всех отчётов).
  • 🛠️ Возможность дополнительной кастомизации (например, добавление легенды или изменение цветов).

FAQ: Частые вопросы о многоугольниках распределения

Можно ли построить многоугольник распределения без группировки данных по интервалам?

Технически да, но это будет некорректно с точки зрения статистики. Многоугольник строится на основе сгруппированных данных, где каждая точка соответствует интервалу. Если использовать сырые данные, график превратится в ломаную линию без аналитической ценности.

Исключение — если у вас уже есть готовые середины интервалов и частоты (например, из внешнего источника). Тогда группировка не нужна.

Как сравнить два распределения на одном графике?

Для этого:

  1. Подготовьте данные для обоих распределений (середины интервалов должны совпадать!).
  2. Постройте точечную диаграмму для первого распределения.
  3. Добавьте второй ряд данных через Выбрать данные → Добавить ряд.
  4. Настройте цвета линий, чтобы они контрастировали (например, синий и красный).
  5. Добавьте легенду для идентификации линий.

Пример: сравнение распределения оценок студентов до и после обучения.

Почему мой многоугольник выглядит как прямая линия?

Это типичная проблема при:

  • 🔹 Слишком малом количестве интервалов (например, 2–3). Увеличьте их число.
  • 🔹 Равномерном распределении данных (все частоты одинаковы). Проверьте исходные данные.
  • 🔹 Ошибке в расчёте середины интервалов. Убедитесь, что используете формулу (нижняя граница + верхняя граница)/2.
Как экспортировать график в высоком разрешении?

Чтобы сохранить многоугольник как изображение:

  1. Кликните по графику правой кнопкой → Копировать.
  2. Вставьте в Paint, Photoshop или другой редактор.
  3. Или используйте Сохранить как рисунок (в новых версиях Excel: правая кнопка по графику → Сохранить как рисунок).

Для векторного формата (например, .emf или .svg):

  1. Скопируйте график.
  2. Вставьте в Word или PowerPoint.
  3. Сохраните файл как PDF, затем конвертируйте в векторный формат.
Можно ли построить многоугольник в Google Sheets?

Да, алгоритм аналогичен Excel:

  1. Сгруппируйте данные по интервалам (используйте функцию =FREQUENCY).
  2. Выделите середины интервалов и частоты.
  3. Вставьте Точечную диаграмму (Вставка → Диаграмма → Точечная).
  4. Добавьте "нулевые" точки для замкнутой линии.

Ограничение: в Google Sheets меньше возможностей для кастомизации осей, чем в Excel.