Плотность частоты — это статистический показатель, который помогает анализировать, как часто встречаются значения в определённом диапазоне данных. В Microsoft Excel его можно рассчитать несколькими способами: от простых формул до продвинутых инструментов вроде Power Query или гистограмм. Но многие пользователи сталкиваются с трудностями: то функция ЧАСТОТА возвращает ошибку, то диапазоны задаются неправильно, то результаты получаются нелогичными.
В этой статье мы разберём 5 рабочих методов расчёта плотности частоты — от базовых до автоматизированных, с учётом нюансов разных версий Excel (2010, 2016, 2019, 365). Вы узнаете, как избежать типичных ошибок, визуализировать результаты и адаптировать формулы под свои задачи. А в конце — FAQ с ответами на частые вопросы и готовые шаблоны для скачивания.
1. Что такое плотность частоты и зачем её считать в Excel
Плотность частоты (или frequency density) показывает, как часто значения попадают в заданный интервал относительно ширины этого интервала. Например, если у вас есть данные о росте 100 человек, вы можете узнать, сколько человек приходится на каждые 10 см в диапазоне 160–180 см. Это полезно для:
- 📊 Анализа распределений — понимания, как данные сгруппированы (нормальное распределение, смещение и т.д.).
- 🔍 Выявления аномалий — например, неожиданно высокой частоты в определённом диапазоне.
- 📈 Построения гистограмм — визуализации плотности для отчётов или презентаций.
- 🧮 Статистических расчётов — подготовки данных для дальнейшего анализа (например, для тестов гипотез).
От обычной частоты (количества значений в интервале) плотность отличается тем, что учитывает ширину интервала. Например, если в диапазоне 10–20 50 значений, а в 20–40 — 100, то частота выше во втором случае. Но плотность может быть одинаковой, потому что второй интервал в 2 раза шире.
⚠️ Внимание: В Excel нет отдельной функции для плотности частоты. Её рассчитывают в два этапа: сначала находят частоту (например, с ЧАСТОТА), затем делят на ширину интервала. Пропуск второго шага — самая распространённая ошибка!
2. Метод 1: Функция ЧАСТОТА + ручной расчёт плотности
Самый простой способ — использовать функцию ЧАСТОТА (англ. FREQUENCY), а затем вручную разделить результаты на ширину интервалов. Этот метод работает во всех версиях Excel, включая Excel 2010.
Алгоритм действий:
- Подготовьте данные: в столбце
A— исходные значения (например,A2:A100), в столбцеC— границы интервалов (например,C2:C6с значениями10, 20, 30, 40, 50). - Выделите ячейки для результатов частоты (например,
D2:D6). - Введите формулу массива:
=ЧАСТОТА(A2:A100; C2:C6)и завершите ввод сочетанием
Ctrl+Shift+Enter(в новых версиях Excel простоEnter). - Рядом с результатами частоты добавьте столбец для плотности. В ячейке
E2введите:=D2/(C3-C2)и протяните формулу вниз.
Пример расчёта:
| Интервал | Частота | Ширина | Плотность частоты |
|---|---|---|---|
| 10–20 | 15 | 10 | 1.5 |
| 20–30 | 25 | 10 | 2.5 |
| 30–40 | 30 | 10 | 3.0 |
| 40–50 | 20 | 10 | 2.0 |
⚠️ Внимание: Если интервалы имеют разную ширину (например,10–20и20–50), формулу плотности нужно корректировать для каждой строки отдельно. В таком случае используйте:=D2/(C3-C2)где
C3-C2— ширина текущего интервала.
Отсортируйте исходные данные по возрастанию|Убедитесь, что границы интервалов не пересекаются|Выделите на 1 ячейку больше для результатов частоты (Excel добавляет категорию "больше максимального значения")|Проверьте, что в интервалах нет пустых ячеек-->
3. Метод 2: Гистограмма с автоматическим расчётом плотности
В Excel 2016 и новее есть встроенный инструмент "Гистограмма" (вкладка Вставка → Вставить статистическую гистограмму), который автоматически рассчитывает частоты. Однако для плотности потребуется доработка.
Пошаговая инструкция:
- Выделите исходные данные (например,
A2:A100). - Перейдите на вкладку
Вставка → Гистограмма → Гистограмма. - Щёлкните правой кнопкой по оси X, выберите
Формат осии задайте параметры бинов (интервалов). - Добавьте столбец с шириной интервалов (например,
=МАКС(A:A)/10для 10 равных интервалов). - Рядом с таблицей частот (которую Excel создаст автоматически) добавьте столбец для плотности:
=Таблица1[Частота]/ширина_интервала
Критическая деталь: инструмент "Гистограмма" в Excel 2016+ использует алгоритм Фреда-Скотта для автоматического определения ширины бинов, который может давать неинтуитивные интервалы. Всегда проверяйте их вручную!
Функция ЧАСТОТА|Гистограмма (вкладка "Вставка")|Сводные таблицы|Power Query|Другой-->
4. Метод 3: Сводные таблицы для динамического анализа
Сводные таблицы позволяют гибко группировать данные и рассчитывать плотность без формул. Этот метод удобен, если исходные данные часто обновляются.
Как настроить:
- Выделите исходные данные (например,
A1:B100, гдеA— значения,B— метки). - Перейдите на вкладку
Вставка → Сводная таблица. - В области
Строкидобавьте поле с данными (Excel автоматически сгруппирует их по интервалам). - Щёлкните правой кнопкой по группировке, выберите
Параметры группировкии задайте ширину интервала. - В область
Значениядобавьте то же поле, но с операциейКоличество(это частота). - Добавьте вычисляемое поле для плотности:
=Количество / ширина_интервала
Преимущество метода: при изменении исходных данных сводная таблица обновляется автоматически. Недостаток: группировка по интервалам в сводных таблицах менее гибкая, чем в функции ЧАСТОТА.
5. Метод 4: Power Query для больших наборов данных
Если у вас тысячи строк, Power Query (доступен в Excel 2016+) поможет автоматизировать расчёт плотности. Этот метод требует начальных навыков работы с Power Query, но даёт максимальную гибкость.
Инструкция:
- Выделите данные, перейдите на вкладку
Данные → Из таблицы/диапазона(илиПолучить данные → Из таблицы). - В редакторе Power Query выберите столбец с данными, затем:
Преобразовать → ГруппировкаУкажите операцию
Количество строки интервал группировки (например,10для диапазонов по 10 единиц). - Добавьте пользовательский столбец для плотности:
= [Количество] / 10(где
10— ширина интервала). - Нажмите
Закрыть и загрузить, чтобы вернуть данные в Excel.
Пример кода на языке M для Power Query:
let
Источник = Excel.CurrentWorkbook(){[Name="Таблица1"]}[Content],
Группировка = Table.Group(Источник, {"Значение"}, {{"Количество", each Table.RowCount(_), type number}}),
ДобавлениеИнтервалов = Table.AddColumn(Группировка, "Интервал", each Number.From([Значение]) & "–" & Number.From([Значение])+10),
ДобавлениеПлотности = Table.AddColumn(ДобавлениеИнтервалов, "Плотность", each [Количество]/10)
in
ДобавлениеПлотности
⚠️ Внимание: В Power Query группировка по интервалам работает только для целых чисел. Если данные дробные (например,12.5), предварительно умножьте их на 10 и округлите с помощьюNumber.Round.
6. Метод 5: Формулы массива для неравномерных интервалов
Если интервалы имеют разную ширину (например, 0–10, 10–50, 50–100), стандартная функция ЧАСТОТА не подходит. В этом случае используйте комбинацию функций СЧЁТЕСЛИМН и деления на ширину интервала.
Пример:
=СЧЁТЕСЛИМН($A$2:$A$100; ">="&C2; $A$2:$A$100; "<"&C3) / (C3-C2)
Где:
$A$2:$A$100— диапазон с данными;C2— нижняя граница интервала;C3— верхняя граница интервала.
Эту формулу нужно протянуть на все интервалы. Для удобства можно создать таблицу с границами и шириной:
| Нижняя граница | Верхняя граница | Ширина | Плотность частоты |
|---|---|---|---|
| 0 | 10 | 10 | =СЧЁТЕСЛИМН(...) / 10 |
| 10 | 50 | 40 | =СЧЁТЕСЛИМН(...) / 40 |
| 50 | 100 | 50 | =СЧЁТЕСЛИМН(...) / 50 |
7. Визуализация плотности частоты: графики и диаграммы
Числовые данные о плотности частоты сложно анализировать без визуализации. В Excel есть несколько способов построить график:
- 📊 Гистограмма с плотностью: Используйте
Вставка → Гистограмма, затем добавьте вспомогательную ось для плотности. - 📉 Линейная диаграмма: Подходит для сравнения плотности в разных интервалах (ось X — середины интервалов, ось Y — плотность).
- 🟥 Тепловая карта: В Excel 365 можно использовать
Условное форматирование → Цветовые шкалыдля визуализации плотности в таблице.
Как построить гистограмму с плотностью:
- Создайте таблицу с интервалами, частотой и плотностью (как в Методе 1).
- Выделите столбцы с интервалами и плотностью, затем
Вставка → Гистограмма с группировкой. - Щёлкните правой кнопкой по ряду плотности, выберите
Формат ряда данныхи укажитеВспомогательная ось. - Добавьте подписи данных для точности.
Пример графика:
(Здесь могло бы быть изображение гистограммы с двумя осями: основная — частота, вспомогательная — плотность. В реальной статье вставьте скриншот.)
8. Типичные ошибки и как их избежать
Даже опытные пользователи Excel допускают ошибки при расчёте плотности частоты. Вот самые распространённые:
- 🔢 Неучёт ширины интервала: Забывают разделить частоту на ширину, получая просто частоту вместо плотности.
- 📏 Неверные границы интервалов: Если интервалы пересекаются (например,
10–20и15–25), функцияЧАСТОТАдаст некорректные результаты. - 🔄 Несогласованные данные: В исходном диапазоне есть текст или пустые ячейки, что приводит к ошибке
#ЗНАЧ!. - 📈 Неправильная визуализация: На графике отображается частота вместо плотности, или оси перепутаны.
Как проверить правильность расчётов:
- Убедитесь, что сумма всех частот равна общему количеству данных.
- Проверьте, что сумма произведений плотностей на ширины интервалов также равна общему количеству данных.
- Постройте график и визуально оцените, логично ли распределение.
Что делать, если ЧАСТОТА возвращает #Н/Д?
Ошибка #Н/Д в функции ЧАСТОТА обычно означает, что:
1. Диапазон интервалов не отсортирован по возрастанию.
2. В диапазоне данных есть нечисловые значения (текст, ошибки).
3. Выделили недостаточно ячеек для результата (нужно на 1 больше, чем интервалов).
Решение: проверьте сортировку, очистите данные от мусора и расширьте диапазон результатов.
FAQ: Ответы на частые вопросы
Можно ли рассчитать плотность частоты без Excel?
Да, в Google Sheets есть аналогичные функции: FREQUENCY (аналог ЧАСТОТА) и инструмент "Гистограмма". Также можно использовать Python с библиотекой pandas (метод value_counts с параметром normalize=True) или R (функция hist).
Почему моя плотность частоты получается больше 1?
Плотность может превышать 1, если ширина интервала меньше единицы. Например, при ширине интервала 0.1 и частоте 5 плотность будет 50. Это нормально — плотность показывает концентрацию значений, а не долю.
Как автоматически подобрать оптимальные интервалы?
В Excel нет встроенного метода, но можно использовать правило Стерджеса для оценки количества интервалов:
=ОКРУГЛВВЕРХ(ЛОГ10(КОЛВО) + 1; 0)
где КОЛВО — количество данных. Ширину интервала рассчитайте как:
=(МАКС(диапазон) - МИН(диапазон)) / количество_интервалов
Можно ли рассчитать плотность для текстовых данных?
Плотность частоты применима только к числовым данным. Для текстовых значений (например, категории товаров) используйте относительную частоту (долю каждого значения от общего числа). Формула:
=СЧЁТЕСЛИ(диапазон; критерий) / СЧЁТ(диапазон)
Как экспортировать результаты плотности в Word или PDF?
Скопируйте таблицу с плотностью и вставьте в Word как Связанный объект Excel (чтобы при изменении данных в Excel таблица в Word обновлялась). Для экспорта в PDF: Файл → Экспорт → Создать PDF/XPS. Чтобы сохранить только график, выделите его, затем Копировать → Вставить в Word как рисунок.