Перцентили в Excel: зачем они нужны и как их правильно считать
Перцентили — это статистический инструмент, который помогает понять распределение данных. Если медиана делит выборку пополам (50-й перцентиль), то перцентили показывают, какое значение не превышает определенный процент наблюдений. Например, 90-й перцентиль означает, что 90% данных меньше или равны этому значению, а 10% — больше.
В Microsoft Excel расчет перцентилей может понадобиться для анализа продаж (какой процент товаров продается дешевле определенной цены), оценки успеваемости (какой балл попадает в топ-10% студентов) или финансового моделирования (определение рисковых порогов). Но здесь есть подводные камни: Excel предлагает несколько функций для расчета, и их результаты могут отличаться. Почему так происходит и как выбрать правильный метод?
В этой статье мы разберем 5 способов расчета перцентилей — от базовых функций до продвинутых техник с динамическими массивами, а также покажем, как визуализировать результаты и избежать типичных ошибок. Если вы работаете с большими данными или готовите отчеты, эта информация сэкономит вам часы ручной работы.
Способ 1: Функция ПЕРСЕНТИЛЬ.ИСКЛ — классический метод
Функция ПЕРСЕНТИЛЬ.ИСКЛ (PERCENTILE.EXC в английской версии) — самый популярный инструмент для расчета перцентилей в современных версиях Excel (2010 и новее). Она исключает крайние значения (0-й и 100-й перцентили) и использует интерполяцию для точных расчетов.
Синтаксис функции:
=ПЕРСЕНТИЛЬ.ИСКЛ(массив_данных; k)
где k — это доля перцентиля от 0 до 1 (например, 0,9 для 90-го перцентиля).
- 📌 Пример:
=ПЕРСЕНТИЛЬ.ИСКЛ(A2:A100; 0,75)вернет 75-й перцентиль для диапазонаA2:A100. - 🔍 Особенность: Если
kне кратен1/(n-1), функция использует линейную интерполяцию. - ⚠️ Ограничение: Не работает для пустых ячеек или текстовых значений — вернет ошибку
#ЧИСЛО!.
Когда использовать: Для большинства задач анализа данных, где нужны точные промежуточные значения (например, расчет квартилей или децилей).
Способ 2: ПЕРСЕНТИЛЬ.ВКЛ — альтернатива с другим алгоритмом
Функция ПЕРСЕНТИЛЬ.ВКЛ (PERCENTILE.INC) включает крайние значения (0-й и 100-й перцентили) и использует другой алгоритм интерполяции. Ее результат может незначительно отличаться от ПЕРСЕНТИЛЬ.ИСКЛ, особенно для небольших выборок.
Синтаксис:
=ПЕРСЕНТИЛЬ.ВКЛ(массив_данных; k)
где k — доля от 0 до 1.
| Функция | Включает 0-й и 100-й перцентили | Формула интерполяции | Пример для k=0,5 |
|---|---|---|---|
ПЕРСЕНТИЛЬ.ИСКЛ |
❌ Нет | x = x1 + (k*(n-1) - i) * (x2 - x1) |
Медиана для нечетного n |
ПЕРСЕНТИЛЬ.ВКЛ |
✅ Да | x = x1 + (k*(n+1) - i) * (x2 - x1) |
Медиана для четного n |
Критическое отличие: Для выборки из 10 элементов 90-й перцентиль в ПЕРСЕНТИЛЬ.ИСКЛ рассчитывается как 9-е значение, а в ПЕРСЕНТИЛЬ.ВКЛ — с учетом интерполяции между 9-м и 10-м.
Способ 3: Ранжирование + ПРОСМОТР — для старых версий Excel
Если вы работаете в Excel 2007 или более ранних версиях, где нет ПЕРСЕНТИЛЬ.ИСКЛ/ВКЛ, можно использовать комбинацию функций РАНГ и ПРОСМОТР. Этот метод также полезен, если вам нужно понять логику расчета.
Алгоритм:
- Отсортируйте данные по возрастанию.
- Рассчитайте позицию перцентиля:
позиция = k * (n + 1). - Используйте
ПРОСМОТРилиИНДЕКСдля извлечения значения.
Пример для 75-го перцентиля в диапазоне A2:A100:
=ПРОСМОТР(0,75*(СЧЁТ(A2:A100)+1); 1/(СЧЁТ(A2:A100)+1); A2:A100)
Почему формула умножает на (n+1)?
Это связано с методом интерполяции, предложенным Hyndman и Fan (1996). Такой подход минимизирует смещение для малых выборок и обеспечивает симметричность расчетов.
⚠️ Внимание: Этот метод не учитывает интерполяцию между значениями, поэтому результат может отличаться от ПЕРСЕНТИЛЬ.ВКЛ на 1-2 позиции для больших массивов.
Способ 4: Динамические массивы — расчет нескольких перцентилей сразу
В Excel 365 и Excel 2021 появилась поддержка динамических массивов, что позволяет рассчитать несколько перцентилей одной формулой. Например, вы можете получить 25-й, 50-й и 75-й перцентили (квартили) за один шаг.
Пример с использованием ПОСЛЕДОВАТЕЛЬНОСТЬ и ПЕРСЕНТИЛЬ.ИСКЛ:
=ПЕРСЕНТИЛЬ.ИСКЛ(A2:A100; ПОСЛЕДОВАТЕЛЬНОСТЬ(0,25; 0,75; 0,25))
Эта формула вернет три значения: 25-й, 50-й и 75-й перцентили.
- 🔹 Преимущество: Одна формула вместо трех отдельных.
- 📊 Применение: Идеально для создания сводных таблиц или дашбордов.
- ⚠️ Нюанс: В более старых версиях Excel формула вернет ошибку
#ИМЯ?.
Убедитесь, что данные отсортированы|Проверьте отсутствие текстовых значений|Используйте Excel 365 или 2021|Тестируйте формулу на небольшой выборке-->
Способ 5: Power Query — для больших наборов данных
Если вы работаете с тысячами строк (например, в файлах CSV или базах данных), расчет перцентилей через Power Query будет эффективнее. Этот инструмент позволяет обрабатывать миллионы записей без замедления Excel.
Инструкция:
- Импортируйте данные в
Power Query(Данные → Получить данные). - Выберите столбец, по которому нужно рассчитать перцентили.
- Перейдите на вкладку
Добавить столбец → Статистика → Перцентиль. - Укажите значение перцентиля (например, 0,9 для 90-го).
Плюсы метода:
- ⚡ Быстрота: Обрабатывает большие объемы данных за секунды.
- 🔄 Автоматизация: Перцентили обновляются при изменении исходных данных.
- 📎 Интеграция: Результаты можно сразу загрузить в модель данных Excel.
⚠️ Внимание: В Power Query используется алгоритм, аналогичный ПЕРСЕНТИЛЬ.ВКЛ. Если вам нужен ПЕРСЕНТИЛЬ.ИСКЛ, придется дорабатывать код на языке M.
Типичные ошибки и как их избежать
Даже опытные пользователи Excel сталкиваются с проблемами при расчете перцентилей. Вот самые распространенные ошибки и способы их решения:
- Ошибка #ЧИСЛО!: Возникает, если в диапазоне есть текстовые значения или пустые ячейки. Решение: Используйте
ЕСЛИОШИБКАили предварительно очистите данные функциейЗНАЧЕН. - Несовпадение с ручным расчетом: Excel использует интерполяцию, а при ручном подсчете часто берут целое значение позиции. Решение: Проверьте формулу расчета позиции (см. Способ 3).
- Округление перцентилей: Например, 99,9-й перцентиль может совпадать с максимумом. Решение: Используйте
ПЕРСЕНТИЛЬ.ИСКЛсk=0,999вместо 1.
📌 Лайфхак: Чтобы проверить правильность расчета, сравните результат Excel с онлайн-калькуляторами перцентилей (например, на Desmos или Wolfram Alpha).
Визуализация перцентилей: графики и условное форматирование
Перцентили сами по себе — это числа, но их можно превратить в наглядные инсайты с помощью визуализации. Вот 3 способа:
- 📊 Боксплот (ящик с усами): Показывает медиану, квартили и выбросы. В Excel его можно построить с помощью
Вставка → Диаграмма → Ящик с усами(доступно с 2016 версии). - 🎨 Условное форматирование: Подсветите ячейки, значения которых попадают в топ-10% или нижние 5%. Используйте правило
"Значение больше чем"=ПЕРСЕНТИЛЬ.ИСКЛ(диапазон; 0,9). - 📈 Линия перцентиля на гистограмме: Добавьте на график горизонтальную линию, соответствующую 90-му перцентилю, с помощью
Добавление элемента диаграммы → Линии.
Пример формулы для условного форматирования (топ-10%):
=A1>ПЕРСЕНТИЛЬ.ИСКЛ($A$1:$A$100; 0,9)
⚠️ Внимание: При построении боксплота Excel по умолчанию использует алгоритм Туки для выбросов (1,5 × IQR). Если ваши данные имеют другое распределение, настройте границы вручную.
FAQ: Ответы на частые вопросы
Можно ли рассчитать перцентили для несортрованных данных?
Да, функции ПЕРСЕНТИЛЬ.ИСКЛ и ПЕРСЕНТИЛЬ.ВКЛ автоматически игнорируют порядок данных. Однако для больших массивов предварительная сортировка ускорит вычисления.
Почему мой 50-й перцентиль не совпадает с медианой?
Это может происходить из-за:
- Использования
ПЕРСЕНТИЛЬ.ВКЛдля четного количества данных (медиана в Excel рассчитывается как среднее двух центральных значений). - Наличия скрытых пустых ячеек или текстовых значений.
Проверьте данные функцией =МЕДИАНА(диапазон) и сравните с =ПЕРСЕНТИЛЬ.ИСКЛ(диапазон; 0,5).
Как рассчитать перцентили по группам (например, по регионам)?
Используйте функцию АГРЕГАТ с параметром 17 (перцентиль.искл) или создайте сводную таблицу с вычисляемым полем. Пример:
=АГРЕГАТ(17; 6; $B$2:$B$100 / ($A$2:$A$100 = "Регион1"); 0,9)
Где $A$2:$A$100 — столбец с регионами, $B$2:$B$100 — данные для анализа.
Чем перцентили отличаются от квартилей и децилей?
Это разновидности перцентилей:
- Квартили: 25-й, 50-й, 75-й перцентили (делят данные на 4 части).
- Децили: 10-й, 20-й, ..., 90-й перцентили (10 частей).
- Перцентили: Любое значение от 0 до 100 (100 частей).
В Excel для квартилей есть отдельная функция =КВАРТИЛЬ.ИСКЛ(диапазон; номер_квартиля).
Можно ли автоматически обновлять перцентили при добавлении новых данных?
Да, для этого:
- Преобразуйте диапазон в умную таблицу (
Главная → Форматировать как таблицу). - Используйте структурированные ссылки в формулах (например,
=ПЕРСЕНТИЛЬ.ИСКЛ(Таблица1[Столбец1]; 0,9)). - Для Power Query настройте автоматическое обновление при открытии файла.