Как в Excel сделать гистограмму и полигон: пошаговое руководство

Визуализация данных является неотъемлемой частью профессионального анализа, позволяя мгновенно оценить структуру массива информации. Когда речь заходит о статистическом распределении числовых значений, классическим инструментом становятся гистограмма и полигон частот. Эти графики помогают понять, как часто встречаются определенные значения в выборке, и выявить закономерности, скрытые в сухих цифрах.

Многие пользователи ошибочно полагают, что для создания таких диаграмм требуются сложные надстройки или сторонние программы. На самом деле, Microsoft Excel обладает встроенным функционалом, достаточным для построения качественных статистических графиков. Важно лишь правильно подготовить исходные данные и знать последовательность действий при настройке осей.

В данной статье мы подробно разберем алгоритм создания гистограммы и полигона распределения. Вы научитесь группировать данные в интервалы, настраивать форматы осей и комбинировать типы диаграмм для получения максимально информативной картины. Это знание пригодится как студентам, так и аналитикам данных.

Подготовка исходных данных для анализа

Прежде чем приступать к построению графиков, необходимо убедиться, что ваш массив данных структурирован корректно. Для статистического анализа обычно требуется один столбец с числовыми значениями, которые представляют собой выборку. Убедитесь, что в столбце отсутствуют текстовые значения, ошибки или пустые ячейки, так как они могут исказить результаты расчетов.

Ключевым этапом подготовки является определение интервалов группировки, или так называемых карманов (bins). Гистограмма показывает частоту попадания значений в определенные диапазоны, поэтому границы этих диапазонов нужно задать заранее. Например, если вы анализируете зарплаты, интервалами могут быть диапазоны 10-20 тыс., 20-30 тыс. и так далее.

  • 📊 Соберите все числовые данные в один непрерывный столбец без пропусков.
  • 📏 Рассчитайте минимальное и максимальное значение в выборке для определения размаха.
  • 📐 Определите шаг интервала (ширину кармана) в зависимости от количества данных.
  • 📝 Создайте отдельный столбец с верхними границами интервалов для построения гистограммы.

⚠️ Внимание: Если вы не зададите интервалы вручную, Excel может выбрать их автоматически, что часто приводит к некорректному отображению распределения с "рваными" краями.

Для удобства работы рекомендуется отсортировать исходный столбец по возрастанию. Это не является обязательным требованием для построения диаграммы, но позволяет визуально проверить данные на наличие выбросов или аномалий перед началом анализа. После сортировки крайние значения будут находиться в начале и конце списка.

Построение гистограммы с помощью надстройки

Самый быстрый способ получить статистический график — использовать встроенную надстройку «Пакет анализа». Этот инструмент автоматически рассчитывает частоту попаданий в интервалы и строит готовую диаграмму. Для активации перейдите в меню Файл, выберите Параметры, затем Надстройки и в нижнем выпадающем списке выберите Надстройки Excel.

В открывшемся окне установите галочку напротив пункта «Анализ данных» и нажмите ОК. После этого в правой части вкладки Данные появится новая кнопка. Нажмите на нее и в списке инструментов выберите «Гистограмма». Откроется диалоговое окно, где нужно указать входной интервал (ваши данные) и интервал карманов (границы групп).

☑️ Проверка перед построением

Выполнено: 0 / 4

Важно правильно настроить параметры вывода. Обязательно поставьте галочку «Вывод графика», чтобы диаграмма появилась на листе. Также можно выбрать опцию «Интегральная кривая», если требуется построить кумуляту, но для классической гистограммы это не требуется. Результатом работы станет новая таблица с частотами и встроенный график столбчатого типа.

Параметр Описание Рекомендация
Входной интервал Столбец с исходными данными Выделять только числа
Интервал карманов Границы группировки Указывать верхние пределы
Вывод Место размещения результата Новый лист или ячейка
График Создание визуализации Обязательно включить

Настройка внешнего вида диаграммы

После создания гистограммы стандартными средствами Excel, вы увидите, что между столбцами имеются зазоры. С точки зрения статистики, гистограмма должна представлять собой непрерывное распределение, поэтому промежутки между столбцами должны отсутствовать. Чтобы исправить это, кликните правой кнопкой мыши по любому столбцу и выберите «Формат ряда данных».

В открывшейся панели найдите параметр «Ширина зазора» и установите его значение в 0%. Столбцы сразу же сомкнутся, и диаграмма приобретет правильный вид гистограммы распределения. Также здесь можно настроить цвет заливки и границы столбцов для улучшения читаемости.

Не забудьте добавить заголовки осей для ясности восприятия. Ось абсцисс (горизонтальная) обычно отображает интервалы значений, а ось ординат (вертикальная) — частоту или количество попаданий. Нажмите на плюсик рядом с диаграммой, выберите «Названия осей» и подпишите их соответствующим образом, например, «Диапазон значений» и «Частота».

Создание полигона распределения частот

Полигон распределения — это ломаная линия, соединяющая точки, координатами которых являются середина интервала и соответствующая ему частота. Он позволяет более плавно оценить характер распределения и часто используется для сравнения нескольких выборок на одном графике. Построить полигон можно на основе уже созданной гистограммы.

Для начала необходимо рассчитать середины интервалов. Если ваши карманы заданы как 10, 20, 30, то середина первого интервала будет равна среднему арифметическому границ. Добавьте новый столбец в таблицу с результатами анализа и вычислите эти значения. Затем кликните правой кнопкой мыши по области диаграммы и выберите «Выбрать данные».

  • 📈 Добавьте новый ряд данных, указав середины интервалов как значения оси X.
  • 🔗 В качестве значений ряда Y укажите столбец с рассчитанной частотой.
  • 📉 Измените тип диаграммы для нового ряда на «График» или «Точки с прямыми отрезками».
  • 🎨 Удалите легенду или переместите её для удобства чтения.

⚠️ Внимание: При построении полигона важно, чтобы линия начиналась и заканчивалась на нулевой частоте, для чего иногда добавляют фиктивные интервалы до первого и после последнего значения.

Теперь у вас на одном листе есть и столбчатая диаграмма, и линейный график. Чтобы полигон выглядел аккуратно, убедитесь, что точки графика попадают точно в центры верхних граней столбцов гистограммы. Это создаст гармоничную визуализацию, где полигон как бы «обтекает» гистограмму, показывая общую тенденцию.

Комбинирование типов диаграмм

Совмещение гистограммы и полигона на одном поле требует использования комбинированного типа диаграммы. В современных версиях Excel это делается через меню «Изменить тип диаграммы». Выберите опцию «Комбинированная» и для ряда с частотами (гистограмма) оставьте тип «Гистограмма с группировкой», а для ряда с полигоном выберите «График».

Часто возникает необходимость использования вторичной оси, если масштабы значений сильно различаются, но для полигона частот, построенного по тем же данным, что и гистограмма, достаточно одной оси Y. Главное — правильно настроить перекрытие рядов. Параметр «Перекрытие рядов» в формате гистограммы лучше установить на 0%, чтобы столбцы не наезжали друг на друга, если их несколько.

📊 Какой график вам удобнее анализировать?
Гистограмма (столбцы)
Полигон (линия)
Комбинированный
Круговая диаграмма

Для улучшения восприятия можно добавить сглаживание линии полигона. Кликните правой кнопкой мыши по линии графика, выберите «Формат ряда данных» и в разделе «Параметры линии» найдите опцию сглаживания. Это сделает линию более плавной, хотя и немного изменит математическую точность углов.

Анализ распределения и выводы

После построения графиков наступает этап интерпретации результатов. Форма гистограммы и полигона может рассказать многое о природе ваших данных. Нормальное распределение характеризуется симметричной колоколообразной формой, где большинство значений сосредоточено вокруг среднего.

Если вы видите смещение влево или вправо, это говорит о асимметрии распределения. Выбросы будут видны как отдельные столбцы, далеко отстоящие от основной массы данных. Полигон помогает легче отследить модальность — наличие одного или нескольких пиков (вершин) на графике.

Что такое эксцесс в контексте гистограммы?

Эксцесс характеризует островершинность распределения. Высокий пик гистограммы по сравнению с нормальным распределением указывает на положительный эксцесс, низкий и широкий — на отрицательный.

Используйте полученные графики для принятия управленческих решений. Например, если гистограмма времени обслуживания клиентов имеет длинный «хвост» вправо, это сигнал о наличии проблемных случаев, требующих отдельного изучения. Визуализация делает такие аномалии очевидными даже для неспециалистов.

Часто задаваемые вопросы (FAQ)

Можно ли построить гистограмму в Excel без надстройки «Анализ данных»?

Да, это возможно. Вы можете использовать функцию ЧАСТОТА (FREQUENCY) для расчета количества попаданий в интервалы, а затем построить обычную столбчатую диаграмму на основе полученных значений. Этот метод более гибкий, так как график будет обновляться автоматически при изменении исходных данных.

В чем принципиальная разница между гистограммой и столбчатой диаграммой?

Гистограмма отображает распределение непрерывных данных, где столбцы примыкают друг к другу, показывая интервалы. Столбчатая диаграмма используется для сравнения дискретных категорий, и между столбцами всегда есть зазоры. В статистике важно не путать эти понятия.

Как изменить количество интервалов (карманов) в готовой гистограмме?

Если гистограмма построена через «Анализ данных», нужно заново запустить инструмент с новыми границами. Если использовалась функция или встроенный тип диаграммы «Гистограмма» (в новых версиях Excel), можно изменить число карманов или их ширину через панель «Формат оси» в разделе «Параметры оси».

Что делать, если полигон выходит за пределы гистограммы?

Это происходит, если точки полигона не совпадают с центрами интервалов гистограммы. Проверьте расчет середин интервалов. Также убедитесь, что при построении графика в качестве подписей оси X использовались именно середины интервалов, а не их границы.