Полигон в Excel: как построить и интерпретировать диаграмму частот

Полигон в Microsoft Excel — это графическое представление распределения частот, где точки на оси X соответствуют значениям интервалов, а на оси Y — их частотам, соединённым ломаной линией. Если вы видите в таблице столбец с данными (например, возраст сотрудников, продажи по месяцам или результаты тестов) и хотите проанализировать их распределение без гистограммы, полигон станет оптимальным решением. В отличие от гистограммы, он подчёркивает тренды и позволяет сравнивать несколько распределений на одном графике.

Строится полигон на основе интервального ряда распределения: сначала данные группируются в интервалы (например, "10-20", "20-30"), затем подсчитывается частота попадания значений в каждый интервал. Excel не имеет встроенной функции "Полигон", но его можно создать вручную через Вставка → Диаграмма → График с маркерами, предварительно подготовив таблицу с границами интервалов и частотами. Ошибки на этом этапе (например, неправильный выбор интервалов или пропуск нулевых частот) приведут к искажению графика.

В этой статье разберём, как правильно подготовить данные, построить полигон с нуля, избежать типичных ошибок и интерпретировать результаты. Особое внимание уделим случаям, когда полигон предпочтительнее гистограммы — например, при анализе временных рядов или сравнении нескольких выборок.

Что такое полигон частот и зачем он нужен

Полигон частот (или полигон распределения) — это разновидность линейного графика, где:

  • 📊 Ось X отображает середины интервалов (например, для интервала "10-20" середина — 15).
  • 📈 Ось Y показывает частоту (количество значений) или относительную частоту (долю) для каждого интервала.
  • 🔗 Точки соединяются ломаной линией, что помогает визуально оценить тренды: симметрию, скошенность или моды распределения.

Основное преимущество полигона перед гистограммой — возможность наложить несколько распределений на один график для сравнения. Например, вы можете построить полигоны продаж по регионам или распределения оценок студентов разных групп. Кроме того, полигон лучше подходит для анализа непрерывных данных (вес, температура, время), где важно увидеть плавные изменения, а не дискретные столбцы.

Когда использовать полигон:

  • 🔍 Для визуализации больших выборок (100+ значений), где гистограмма будет перегружена столбцами.
  • 📉 При анализе временных рядов (например, динамика температуры по часам).
  • 📊 Для сравнения нескольких распределений (например, доходы мужчин и женщин).
⚠️ Внимание: Полигон не подходит для категориальных данных (например, "красный/зелёный/синий") — в таких случаях используйте столбчатую диаграмму.

Подготовка данных для полигона в Excel

Чтобы построить полигон, сначала нужно преобразовать исходные данные в интервальный ряд распределения. Рассмотрим процесс на примере: у вас есть столбец с возрастом 50 сотрудников (от 22 до 65 лет), и вы хотите проанализировать распределение возрастов.

Шаги подготовки:

  1. Определите количество интервалов. Оптимальное число — от 5 до 20 (зависит от объёма данных). Для 50 значений подойдёт 7-10 интервалов. Ширину интервала рассчитайте по формуле:
    = (Максимум - Минимум) / Количество интервалов

    Например, для возрастов 22-65 лет и 7 интервалов: (65-22)/7 ≈ 6.14 → округлите до 6.

  2. Создайте таблицу с границами интервалов. В первом столбце укажите нижние границы (22, 28, 34...), во втором — верхние (27, 33, 39...).
  3. Подсчитайте частоты. Используйте функцию ЧАСТОТА (array formula) или СЧЁТЕСЛИМН для каждого интервала. Например:
    =СЧЁТЕСЛИМН($A$2:$A$51; ">="&B2; $A$2:$A$51; "<"&C2)

    где A2:A51 — исходные данные, B2 и C2 — границы интервала.

  4. Добавьте столбец с серединами интервалов. Формула: = (Верхняя граница + Нижняя граница) / 2.

Пример подготовленной таблицы:

Нижняя границаВерхняя границаСерединаЧастота
222724.53
283330.58
343936.512
404542.515
465148.59
525754.52
586561.51
⚠️ Внимание: Если в каком-то интервале частота равна 0, не исключайте его из таблицы — на графике это будет видно как точка на оси X, что важно для корректного анализа.

1. Определите минимум и максимум исходных данных|2. Рассчитайте ширину интервала|3. Создайте столбцы с границами и серединами интервалов|4. Подсчитайте частоты для каждого интервала|5. Проверьте, что сумма частот равна количеству исходных данных-->

Пошаговая инструкция: как построить полигон в Excel

Когда данные подготовлены, переходите к созданию графика. Используем Excel 2016-2023 или Microsoft 365 (в более старых версиях шаги могут незначительно отличаться).

Алгоритм действий:

  1. Выделите столбцы с серединами интервалов и частотами. В нашем примере это столбцы "Середина" и "Частота".
  2. Перейдите на вкладку Вставка → выберите Вставить график с маркерами (первый вариант в разделе "Графики").
  3. Настройте оси:
    • 📌 Кликните правой кнопкой по оси X → Выбрать данные → убедитесь, что в поле "Подписи оси X" указаны середины интервалов.
    • 📌 Для оси Y установите минимальное значение 0 (клик правой кнопкой → Формат осиПараметры оси).
  4. Добавьте заголовки и легенду:
    • 🏷️ Кликните по графику → Добавить элемент диаграммы → выберите Заголовок диаграммы и Название осей.
    • 🎨 Уберите фон и ненужные линии: КонструкторСтили диаграмм → выберите минималистичный стиль.

Пример формулы для оси X (если Excel неверно определил данные):

=Лист1!$C$2:$C$8

где C2:C8 — столбец с серединами интервалов.

Если вам нужно сравнить два распределения (например, возраст мужчин и женщин), добавьте второй ряд данных через Выбрать данныеДобавить и укажите диапазоны для второй выборки.

Как изменить тип линии полигона

1. Кликните правой кнопкой по линии графика → Формат ряда данных.

2. В разделе Стиль линии выберите Сплошная линия и установите толщину 2-3 пт.

3. В разделе Маркер выберите Встроенный (например, круг) и установите размер 8-10 пт.

Типичные ошибки при построении полигона и как их избежать

Даже опытные пользователи Excel допускают ошибки, которые искажают полигон. Вот наиболее распространённые проблемы и способы их решения:

ОшибкаПричинаРешение
Линия полигона не начинается/не заканчивается на оси X Отсутствуют интервалы с нулевой частотой на границах Добавьте интервалы с частотой 0 до минимального и после максимального значения
График выглядит как ломаная без смысла Слишком мало интервалов или их ширина неравномерна Используйте формулу Стерджесса для количества интервалов: =1 + 3.322 * LOG10(n), где n — количество данных
Ось X отображает номера точек (1, 2, 3...), а не значения Excel воспринял середины интервалов как категории Кликните по оси X → Формат оси → установите Минимальное значение и Максимальное значение вручную
Полигон не показывает пики распределения Интервалы слишком широкие Уменьшите ширину интервала или увеличьте их количество

Ещё одна частая ошибка — использование абсолютных частот вместо относительных при сравнении выборок разного размера. Например, если у вас 100 мужчин и 50 женщин, полигоны с абсолютными частотами будут несопоставимы. Решение: нормируйте частоты, разделив их на общее количество данных в каждой группе.

Полигон vs гистограмма: когда что использовать

И полигон, и гистограмма визуализируют распределение данных, но подходят для разных задач. Вот ключевые различия:

  • 📊 Гистограмма:
    • Показывает плотность распределения через высоту столбцов.
    • Лучше для дискретных данных (например, количество дефектов: 0, 1, 2...).
    • Подчёркивает разрывы между категориями.
  • 📈 Полигон:
    • Показывает тренды и форму распределения (симметричность, скошенность).
    • Лучше для непрерывных данных (вес, рост, время).
    • Позволяет сравнивать несколько распределений на одном графике.

Примеры, когда полигон предпочтительнее:

  • 🔬 Анализ научных данных: распределение результатов эксперимента по группам.
  • 📅 Временные ряды: динамика температуры по часам суток.
  • 👥 Социологические опросы: сравнение распределения доходов среди разных возрастных групп.

Если вам нужно одновременно показать плотность (как в гистограмме) и тренд (как в полигоне), используйте комбинированную диаграмму: стройте гистограмму и добавляйте линию тренда через Добавить элемент диаграммы → Линия тренда.

Гистограмма|Полигон|Оба варианта|Другой тип-->

Продвинутые приёмы: настройка и интерпретация полигона

Базовый полигон показывает распределение, но его можно усовершенствовать для глубокого анализа. Рассмотрим продвинутые техники:

1. Добавление линии нормального распределения

Если ваши данные должны подчиняться нормальному закону (например, рост людей), наложите на полигон теоретическую кривую:

  1. Вычислите среднее (=СРЗНАЧ()) и стандартное отклонение (=СТАНДОТКЛОН()) ваших данных.
  2. Создайте столбец с теоретическими частотами по формуле нормального распределения:
    =НОРМ.РАСП(x; среднее; ст.откл; ЛОЖЬ)

    где x — середины интервалов.

  3. Добавьте новый ряд данных на график и измените его тип на Гладкая линия.

2. Сравнение нескольких полигонов

Чтобы сравнить два распределения (например, до и после эксперимента):

  • 📊 Постройте полигоны на одном графике, используя разные цвета.
  • 🔍 Добавьте легенду и подписи данных для ключевых точек.
  • 📏 Нормируйте частоты, если выборки разного размера (разделите частоты на общее количество данных в каждой группе).

3. Анализ формы полигона

Форма линии полигона расскажет о свойствах данных:

  • 🔔 Симметричный колокол — нормальное распределение.
  • 📉 Скошенность вправо — большинство значений сосредоточено слева (например, доходы: мало людей с очень высокими доходами).
  • 📈 Скошенность влево — пик смещён вправо (например, возраст смерти: большинство живёт до 70-80 лет).
  • 🏔️ Несколько пиков — возможно, в данных смешаны разные группы (например, рост мужчин и женщин вместе).

Примеры использования полигона в реальных задачах

Разберём практические кейсы, где полигон помогает принять обоснованные решения.

1. Анализ продаж по времени

Задача: Определить пиковые часы продаж в кафе за неделю.

  • 📅 Данные: Чек на каждый час работы (например, с 8:00 до 22:00).
  • 📊 Решение: Постройте полигон с часами по оси X и количеством чеков по оси Y. Пики покажут часы наибольшей загрузки.
  • 💡 Вывод: Если пик в 12:00 и 18:00, можно оптимизировать график сотрудников.

2. Контроль качества на производстве

Задача: Проанализировать отклонения веса упаковок от стандарта (200 г ±5 г).

  • ⚖️ Данные: Вес 500 упаковок, измеренный с точностью до грамма.
  • 📈 Решение: Постройте полигон с интервалом 1 г. Если распределение симметрично и укладывается в 195-205 г, процесс под контролем.
  • ⚠️ Предупреждение: Асимметрия или выбросы сигнализируют о проблемах с оборудованием.

3. Оценка результатов тестирования

Задача: Сравнить распределение баллов ЕГЭ по математике в двух школах.

  • 📚 Данные: Баллы 200 учеников из школы A и 150 из школы B.
  • 📊 Решение: Постройте два полигона на одном графике с интервалом 10 баллов. Если полигон школы A сдвинут вправо, её ученики показывают лучшие результаты.
  • 🎯 Действие: Проанализируйте методы преподавания в школе A.

FAQ: Частые вопросы о полигонах в Excel

Можно ли построить полигон без предварительной группировки данных в интервалы?

Нет, полигон требует заранее сгруппированные данные. Если у вас сырые данные (например, список возрастов), сначала создайте таблицу с интервалами и частотами. Альтернатива — использовать гистограмму (в Excel 2016+ есть встроенная функция Гистограмма в разделе "Анализ данных").

Как добавить на полигон линию среднего значения?

1. Вычислите среднее значение ваших данных (=СРЗНАЧ()).

2. Добавьте на график горизонтальную линию: кликните по полигону → Добавить элемент диаграммыЛинииДополнительные параметры линий → выберите Средняя линия.

3. Вручную установите значение линии равным среднему.

Почему мой полигон выглядит как прямая линия?

Это происходит, если:

  • Все частоты одинаковые (равномерное распределение).
  • Интервалы слишком широкие и "сгладили" вариации.
  • Вы ошиблись в формулах подсчёта частот (например, использовали СЧЁТ вместо СЧЁТЕСЛИМН).
Решение: Уменьшите ширину интервалов или проверьте формулы.

Можно ли построить полигон в Google Sheets?

Да, алгоритм аналогичен Excel:

1. Подготовьте таблицу с интервалами и частотами.

2. Выделите данные → ВставкаДиаграмма → выберите График.

3. В настройках диаграммы укажите, что первая колонка — это метки оси X.


Ограничение: В Google Sheets меньше вариантов оформления линии и маркеров.

Как экспортировать полигон в Word или PowerPoint?

1. Кликните по графику в Excel → Копировать (или Ctrl+C).

2. Вставьте в Word/PowerPoint через Специальная вставка → выберите Объект листа Microsoft Excel (чтобы график оставался редактируемым) или Изображение (если изменения не нужны).


Совет: Для презентаций используйте минималистичный стиль графика без фона.