Как рассчитать процентили в Excel: формулы, примеры и нюансы

Процентили — это статистические показатели, которые делят упорядоченный набор данных на 100 равных частей. Они широко используются в аналитике, медицине, финансах и других областях для оценки распределения значений. Например, 90-й процентиль показывает значение, ниже которого находится 90% всех данных в выборке. В Microsoft Excel расчёт процентилей можно выполнить несколькими способами, но не все функции работают одинаково — и это часто становится источником ошибок.

Многие пользователи путают процентили с квартилями (которые делят данные на 4 части) или медианой (50-й процентиль). В этой статье разберём, как правильно использовать функции ПРОЦЕНТИЛЬ, ПЕРСЕНТИЛЬ.ВКЛ, ПЕРСЕНТИЛЬ.ИСКЛ и другие инструменты Excel для точного вычисления. Также рассмотрим типичные ошибки, которые искажают результаты, и альтернативные методы для старых версий программы.

📊 Как часто вы используете процентили в работе?
Ежедневно
Несколько раз в неделю
Редико
Никогда

Что такое процентили и зачем они нужны

Процентиль — это мера положения, которая указывает, какой процент значений в наборе данных меньше или равен определённому значению. Например, если ваш доход попадает в 75-й процентиль по стране, это означает, что 75% населения зарабатывают меньше вас. Процентили помогают:

  • 📊 Сравнивать индивидуальные результаты с общей выборкой (например, рост ребёнка по медицинским нормам).
  • 💰 Анализировать распределение доходов, цен или продаж.
  • 📈 Определять пороговые значения для сегментации данных (например, топ-10% клиентов).
  • 🔬 Использовать в научных исследованиях для оценки отклонений.

В отличие от среднего или медианы, процентили дают более детальное представление о распределении данных. Например, в наборе {10, 20, 30, 40, 50} медиана равна 30, а 75-й процентиль — 40. Это показывает, что 75% значений не превышают 40, тогда как медиана делит выборку ровно пополам.

Важно понимать, что процентили зависят от метода расчёта. Excel предлагает несколько функций, которые могут давать разные результаты для одних и тех же данных. Это связано с тем, как программа интерполирует значения между соседними точками.

Функции Excel для расчёта процентилей

В современных версиях Excel (2010 и новее) доступно три основные функции для работы с процентилями. Каждая из них использует свой алгоритм интерполяции, что может привести к различным результатам:

  1. ПРОЦЕНТИЛЬ(массив; k) — устаревшая функция, сохранённая для совместимости. Использует метод n·p + 0.5.
  2. ПЕРСЕНТИЛЬ.ВКЛ(массив; k) — включает минимальное и максимальное значения в расчёт (метод n·p + 1).
  3. ПЕРСЕНТИЛЬ.ИСКЛ(массив; k) — исключает крайние значения (метод n·p - 1).

Где:

  • массив — диапазон ячеек с данными;
  • k — процентиль от 0 до 1 (например, 0,75 для 75-го процентиля).

Разберём на примере. Предположим, у нас есть данные о продажах за месяц в ячейках A1:A10: {12, 15, 18, 22, 25, 30, 35, 40, 45, 50}. Рассчитаем 25-й процентиль:

Функция Формула Результат Пояснение
ПРОЦЕНТИЛЬ =ПРОЦЕНТИЛЬ(A1:A10; 0,25) 19,25 Интерполирует между 18 и 22
ПЕРСЕНТИЛЬ.ВКЛ =ПЕРСЕНТИЛЬ.ВКЛ(A1:A10; 0,25) 18 Берёт точное значение из массива
ПЕРСЕНТИЛЬ.ИСКЛ =ПЕРСЕНТИЛЬ.ИСКЛ(A1:A10; 0,25) 16,5 Исключает крайние значения

Критичная разница: функция ПЕРСЕНТИЛЬ.ИСКЛ может возвращать значения за пределами исходного диапазона (например, 16,5 при минимальном значении 12). Это важно учитывать при анализе данных с выбросами.

Пошаговая инструкция: как рассчитать процентиль

Рассмотрим универсальный алгоритм на примере расчёта 90-го процентиля для набора данных о времени выполнения задачи (в минутах):

Подготовьте данные в одном столбце (например, A1:A20)|Отсортируйте значения по возрастанию (Данные → Сортировка)|Выберите функцию в зависимости от задачи (ПЕРСЕНТИЛЬ.ВКЛ для большинства случаев)|Введите диапазон и процентиль (например, =ПЕРСЕНТИЛЬ.ВКЛ(A1:A20; 0,9))|Проверьте результат на логичность (должен быть близок к максимальному значению для высоких процентилей)

-->

Допустим, у нас есть следующие данные в A1:A10:


15

22

18

35

12

40

28

19

33

25

Шаги:

  1. Сортируем данные: 12, 15, 18, 19, 22, 25, 28, 33, 35, 40.
  2. В ячейке B1 вводим формулу: =ПЕРСЕНТИЛЬ.ВКЛ(A1:A10; 0,9).
  3. Получаем результат: 37,7 (интерполяция между 35 и 40).

Если используем ПЕРСЕНТИЛЬ.ИСКЛ, результат будет 38,5 — разница обусловлена методом расчёта. Для большинства практических задач подходит ПЕРСЕНТИЛЬ.ВКЛ, так как он даёт более консервативные оценки.

Почему результаты функций отличаются?

Функции используют разные алгоритмы интерполяции:

- ПРОЦЕНТИЛЬ: (n-1)·p + 1

- ПЕРСЕНТИЛЬ.ВКЛ: (n+1)·p

- ПЕРСЕНТИЛЬ.ИСКЛ: (n-1)·p + 1

Где n — количество элементов, p — процентиль (0,25 для 25-го процентиля).

Типичные ошибки и как их избежать

Даже опытные пользователи Excel допускают ошибки при работе с процентилями. Вот самые распространённые:

⚠️ Внимание: Если в данных есть пустые ячейки или текст, функции процентиля вернут ошибку #ЧИСЛО!. Всегда проверяйте массив на наличие нечисловых значений с помощью =ЕЧИСЛО().
  • 🔢 Несортрованные данные. Хотя Excel сортирует значения автоматически, вручную отсортированный массив поможет избежать ошибок при визуальной проверке.
  • 📉 Неправильный выбор функции. Например, использование ПЕРСЕНТИЛЬ.ИСКЛ для небольших выборок (менее 10 значений) может дать некорректные результаты.
  • 🔄 Округление процентиля. Аргумент k должен быть числом от 0 до 1 с точностью до 4 знаков (например, 0,95 для 95-го процентиля).
  • 📊 Игнорирование выбросов. Крайние значения (выбросы) могут искажать процентили. В таких случаях используйте УСЕЧЕННОЕ.СРЗНАЧ для предварительной очистки данных.

Пример ошибки: если ввести =ПЕРСЕНТИЛЬ.ВКЛ(A1:A10; 1,1), Excel вернёт ошибку, так как процентиль не может превышать 1 (или 100%). Также распространена путаница между процентилями и перцентилями (в некоторых источниках термины используются как синонимы, но в Excel есть отдельная функция ПЕРЦЕНТИЛЬ для ранжирования).

⚠️ Внимание: В Excel 2007 и ранее доступна только функция ПРОЦЕНТИЛЬ, которая может давать результаты, отличные от современных аналогов. Для совместимости используйте формулу массива:
=МЕДИАНА(ЕСЛИ(A1:A10<=ПЕРСЕНТИЛЬ.ВКЛ(A1:A10;0,9);A1:A10))

(вводится с Ctrl+Shift+Enter).

Альтернативные методы расчёта

Если стандартные функции не подходят (например, нужна специфическая интерполяция), можно использовать:

  1. Формулу массива для пользовательского расчёта:
    =МИН(ЕСЛИ(A1:A10>=ПЕРСЕНТИЛЬ.ВКЛ(A1:A10;0,75);A1:A10))

    (находит минимальное значение, которое больше или равно 75-му процентилю).

  2. Линейную интерполяцию вручную:
    =ИНДЕКС(A1:A10; ПОИСКПОЗ(0,9*(СЧЁТ(A1:A10)-1)+1;A1:A10;1))
  3. Power Query (для больших наборов данных):

    - Загрузите данные в Power Query (Данные → Из таблицы/диапазона).

    - Добавьте столбец с процентилем: = Number.Percentile([Column1], 0.9).

Для визуализации процентилей можно построить ящик с усами (box plot):

  • Рассчитайте квартили (ПЕРСЕНТИЛЬ.ВКЛ для 0,25; 0,5; 0,75).
  • Найдите минимальное и максимальное значения (с учётом выбросов).
  • Постройте график с помощью Вставка → Диаграмма → Точечная.

Практическое применение процентилей

Процентили помогают решать реальные задачи. Рассмотрим несколько примеров:

  • 🏥 Медицина: Оценка роста/веса детей по центильным таблицам. Формула:
    =ПЕРСЕНТИЛЬ.ВКЛ(Диапазон_роста; Рост_ребёнка/100)

    покажет, в какой процентиль попадает ребёнок.

  • 💼 HR-аналитика: Сегментация сотрудников по производительности. Например, топ-10% можно найти так:
    =ПЕРСЕНТИЛЬ.ИСКЛ(Диапазон_KPI; 0,9)
  • 📈 Финансы: Анализ доходности портфеля. 25-й процентиль покажет "нижнюю границу" доходности в 75% случаев.
  • 🎓 Образование: Оценка результатов тестов. Если 90-й процентиль равен 85 баллам, то 90% студентов набрали ≤85.

Для динамического анализа можно создать таблицу с автоматическим расчётом процентилей для разных значений. Например:

Процентиль Формула Значение (для данных A1:A50)
10-й =ПЕРСЕНТИЛЬ.ВКЛ(A1:A50; 0,1) 12,4
50-й (медиана) =ПЕРСЕНТИЛЬ.ВКЛ(A1:A50; 0,5) 28,0
90-й =ПЕРСЕНТИЛЬ.ВКЛ(A1:A50; 0,9) 45,6
99-й =ПЕРСЕНТИЛЬ.ВКЛ(A1:A50; 0,99) 50,0

Для автоматизации можно использовать таблицы данных (Данные → Анализ "что-если" → Таблица данных), чтобы быстро пересчитывать процентили при изменении исходных данных.

Сравнение с другими статистическими мерами

Процентили часто путают с похожими показателями. Разберём ключевые различия:

Показатель Описание Когда использовать Функция в Excel
Процентиль Делит данные на 100 частей Анализ распределения, сегментация ПЕРСЕНТИЛЬ.ВКЛ
Квартиль Делит данные на 4 части (25%, 50%, 75%) Краткий анализ разброса КВАРТИЛЬ
Медиана 50-й процентиль (середина данных) Оценка центрального значения МЕДИАНА
Среднее Сумма значений, делённая на их количество Общая тенденция (но чувствительно к выбросам) СРЗНАЧ
Мода Наиболее частое значение Анализ популярности МОДА.ОДН

Например, для набора {10, 20, 30, 40, 50, 1000}:

  • Среднее = 191,7 (искажено выбросом 1000);
  • Медиана = 35 (устойчива к выбросам);
  • 90-й процентиль = 50 (показывает реальный разброс без крайних значений).

Процентили особенно полезны, когда данные имеют асимметричное распределение или содержат выбросы. В таких случаях они дают более надёжную оценку, чем среднее или стандартное отклонение.

FAQ: Частые вопросы о процентилях в Excel

🔹 Почему моя функция ПЕРСЕНТИЛЬ.ВКЛ возвращает ошибку #ИМЯ?

Это означает, что ваша версия Excel не поддерживает эту функцию. Она появилась в Excel 2010. Для старых версий используйте ПРОЦЕНТИЛЬ или обновите программу. Также проверьте правильность написания функции — регистр не важен, но опечатки приводят к ошибкам.

🔹 Как рассчитать процентиль для несортрованных данных?

Excel автоматически сортирует данные при расчёте процентилей, поэтому предварительная сортировка не обязательна. Однако для визуального контроля рекомендуется отсортировать массив (Данные → Сортировка от минимального к максимальному).

🔹 Можно ли рассчитать процентиль для текстового диапазона?

Нет, функции процентилей работают только с числовыми данными. Если в диапазоне есть текст, Excel вернёт ошибку #ЧИСЛО!. Предварительно очистите данные с помощью =ЕЧИСЛО() или Фильтр.

🔹 В чём разница между ПЕРСЕНТИЛЬ.ВКЛ и ПЕРСЕНТИЛЬ.ИСКЛ?

ПЕРСЕНТИЛЬ.ВКЛ включает минимальное и максимальное значения в расчёт (метод n·p + 1), тогда как ПЕРСЕНТИЛЬ.ИСКЛ их исключает (метод n·p - 1). Для небольших выборок разница может быть значительной. Например, для массива {10, 20, 30}:

  • ПЕРСЕНТИЛЬ.ВКЛ(..., 0,5) вернёт 20;
  • ПЕРСЕНТИЛЬ.ИСКЛ(..., 0,5) вернёт 15 (интерполяция между 10 и 20).

🔹 Как визуализировать процентили на графике?

Создайте ящик с усами:

  1. Рассчитайте квартили (ПЕРСЕНТИЛЬ.ВКЛ для 0,25; 0,5; 0,75).
  2. Найдите минимальное и максимальное значения без выбросов (обычно это 1,5×межквартильный размах от квартилей).
  3. Постройте точечную диаграмму с вертикальными линиями для квартилей и точками для выбросов.

Альтернатива — использовать надстройку Box Plot (доступна в Excel 2016+ через Вставка → Диаграммы → Ящик с усами).