Процентили — это статистический инструмент, который помогает определить положение конкретного значения в наборе данных. Например, если вы знаете, что ваш доход находится в 90-м процентиле, это означает, что 90% людей зарабатывают меньше вас. В Microsoft Excel расчёт процентилей упрощается благодаря встроенным функциям, но многие пользователи не знают, какую из них выбрать или как правильно применить.
В этой статье мы разберём три основных метода поиска процентилей: с помощью функций PERCENTILE, PERCENTILE.INC и PERCENTILE.EXC, а также покажем, как интерпретировать результаты. Вы узнаете, в каких случаях использовать каждую функцию, как избежать типичных ошибок и как визуализировать процентили на графиках. Даже если вы новичок в статистике, наши пошаговые инструкции с примерами помогут разобраться.
Процентили часто применяются в аналитике, финансах, медицине и образовании. Например, учителя используют их для оценки успеваемости учеников, а HR-специалисты — для анализа зарплат. В Excel эти расчёты занимают секунды, но только если знать нюансы. Мы расскажем, почему иногда результаты функций отличаются и как это исправить.
Что такое процентиль и зачем он нужен
Процентиль — это значение, ниже которого находится определённый процент наблюдений в выборке. Например, 25-й процентиль (или первый квартиль) показывает границу, ниже которой лежат 25% данных. Процентили делят упорядоченный набор чисел на 100 равных частей, что делает их незаменимыми для анализа распределений.
Вот несколько практических применений:
- 📊 Статистика: сравнение результатов тестов, роста, веса и других показателей с нормой.
- 💰 Финансы: анализ доходов населения или распределения инвестиционных портфелей.
- 🏥 Медицина: оценка показателей здоровья (например, уровня холестерина) относительно возрастной группы.
- 🎓 Образование: определение рейтингов студентов или школ.
В Excel процентили рассчитываются автоматически, но важно понимать, что они показывают относительное положение значения, а не его абсолютную величину. Например, если ваш рост находится в 75-м процентиле, это не означает, что он равен 75 см — это означает, что 75% людей в выборке ниже вас.
Процентили тесно связаны с другими статистическими мерами:
- Квартили — делят данные на 4 части (25%, 50%, 75%).
- Децили — на 10 частей (10%, 20%, ..., 90%).
- Медиана — это 50-й процентиль.
Три функции Excel для расчёта процентилей
В Excel есть три основные функции для работы с процентилями. Они похожи, но имеют ключевые различия в алгоритмах расчёта. Давайте разберём каждую:
1. PERCENTILE (устаревшая, но всё ещё работает)
Эта функция доступна для совместимости со старыми версиями Excel (до 2010 года). Она использует метод интерполяции, где процентиль рассчитывается как:
PERCENTILE(массив; k)
где k — процентиль от 0 до 1 (например, 0,25 для 25-го процентиля).
2. PERCENTILE.INC (включительный метод)
Более современная версия, которая включает минимальное и максимальное значения в расчёт. Формула:
PERCENTILE.INC(массив; k)
Здесь k также варьируется от 0 до 1. Эта функция используется чаще всего, так как даёт более интуитивно понятные результаты.
3. PERCENTILE.EXC (исключительный метод)
Исключает крайние значения (0-й и 100-й процентили). Формула:
PERCENTILE.EXC(массив; k)
Здесь k должен быть строго между 0 и 1 (например, 0,05 для 5-го процентиля). Эта функция полезна, когда нужно избежать влияния выбросов.
Разница между методами становится заметна на небольших выборках. Например, для массива {1, 2, 3, 4}:
PERCENTILE.INCдля 25-го процентиля вернёт 1,75.PERCENTILE.EXCдля того же процентиля вернёт 1,5.
Пошаговая инструкция: как рассчитать процентиль
Рассмотрим практический пример. Предположим, у нас есть данные о продажах 10 менеджеров за месяц (в тысячах рублей):
| Менеджер | Продажи |
|---|---|
| Иванов | 120 |
| Петров | 150 |
| Сидорова | 180 |
| Кузнецов | 200 |
| Васильева | 220 |
| Новиков | 250 |
| Смирнова | 300 |
| Фёдоров | 350 |
| Алексеева | 400 |
| Михайлов | 500 |
Нам нужно найти 25-й и 75-й процентили, чтобы понять распределение продаж.
Шаг 1. Введите данные в столбец (например, A2:A11).
Шаг 2. Для расчёта 25-го процентиля в любой ячейке введите:
=PERCENTILE.INC(A2:A11; 0,25)
Шаг 3. Для 75-го процентиля:
=PERCENTILE.INC(A2:A11; 0,75)
Результаты:
- 25-й процентиль = 190 (25% менеджеров продали ≤ 190 тыс. руб.).
- 75-й процентиль = 325 (75% менеджеров продали ≤ 325 тыс. руб.).
☑️ Проверка перед расчётом процентилей
Разница между PERCENTILE.INC и PERCENTILE.EXC
Основное отличие этих функций — обработка крайних значений. Давайте разберём на том же примере с продажами.
PERCENTILE.INC включает минимальное и максимальное значения:
- Для
k=0вернёт 120 (минимум). - Для
k=1вернёт 500 (максимум).
PERCENTILE.EXC их исключает:
- Для
k=0,1(10-й процентиль) вернёт 129. - Для
k=0,9(90-й процентиль) вернёт 455.
Когда использовать какую функцию?
- 📌 INC: если важны все данные, включая крайние значения (например, анализ зарплат в компании).
- 📌 EXC: если нужно исключить выбросы (например, при анализе времени выполнения задач, где есть аномально медленные результаты).
⚠️ Внимание: ФункцияPERCENTILE.EXCвернёт ошибку#ЧИСЛО!, если значениеk≤ 1/(n+1) или ≥ n/(n+1), гдеn— количество элементов в массиве. Например, для 10 значений минимальныйk= 1/11 ≈ 0,09.
Как найти процентиль для конкретного значения
Иногда требуется не рассчитать процентиль для заданного k, а определить, в каком процентиле находится конкретное значение. Для этого используется функция PERCENTRANK (или её современные аналоги PERCENTRANK.INC и PERCENTRANK.EXC).
Вернёмся к нашему примеру с продажами. Допустим, мы хотим узнать, в каком процентиле находится результат Смирновой (300 тыс. руб.). Введите:
=PERCENTRANK.INC(A2:A11; 300)
Функция вернёт ≈0,67, то есть 67-й процентиль. Это означает, что 67% менеджеров продали меньше или столько же, сколько Смирнова.
Если использовать PERCENTRANK.EXC:
=PERCENTRANK.EXC(A2:A11; 300)
Результат будет ≈0,64 (64-й процентиль).
Разница возникает из-за метода расчёта:
INCвключает повторяющиеся значения.EXCих исключает, что даёт более консервативную оценку.
Почему PERCENTRANK может возвращать значения >1 или <0?
Это происходит, если искомое значение выходит за пределы массива. Например, PERCENTRANK.INC для значения 100 в нашем примере вернёт ≈-0,17 (ниже минимума), а для 600 — ≈1,22 (выше максимума).
Типичные ошибки и как их избежать
При работе с процентилями в Excel пользователи часто сталкиваются с ошибками. Вот самые распространённые и способы их решения:
1. Ошибка #ЧИСЛО! в PERCENTILE.EXC
Причина: значение k выходит за допустимые пределы. Например, для массива из 5 элементов минимальный k = 1/6 ≈ 0,167.
Решение: используйте PERCENTILE.INC или скорректируйте k.
2. Неправильная сортировка данных
Процентили рассчитываются для упорядоченного массива. Если данные не отсортированы, результат может быть некорректным.
Решение: отсортируйте столбец по возрастанию (Данные → Сортировка от минимального к максимальному).
3. Пустые ячейки или текст в массиве
Функции процентилей игнорируют пустые ячейки, но текстовые значения приводят к ошибке #ЗНАЧ!.
Решение: очистите массив от нечисловых данных или используйте ЕСЛИОШИБКА:
=ЕСЛИОШИБКА(PERCENTILE.INC(A2:A11; 0,5); "Ошибка данных")
4. Использование k в процентах, а не в долях
Многие ошибочно вводят k=25 вместо k=0,25.
Решение: всегда делите процент на 100 (например, 25% → 0,25).
⚠️ Внимание: Если в ваших данных есть повторяющиеся значения, функцииPERCENTILEиPERCENTRANKмогут давать неинтуитивные результаты. Например, в массиве{10, 20, 20, 30}50-й процентиль будет равен 20, а не среднему между 20 и 30. Это нормально — так работает алгоритм интерполяции.
Визуализация процентилей на графиках
Процентили удобно отображать на графиках, особенно при анализе распределений. В Excel для этого подходит ящик с усами (box plot), который показывает:
- 📦 Медиану (50-й процентиль).
- 📦 Квартили (25-й и 75-й процентили).
- 📦 Выбросы (значения за пределами 1,5×IQR от квартилей).
Как построить box plot в Excel:
- Рассчитайте квартили с помощью
QUARTILE.INC. - Найдите размах (разницу между 75-м и 25-м процентилями).
- Вычислите границы "усов":
- Нижняя граница = 25-й процентиль − 1,5×IQR.
- Верхняя граница = 75-й процентиль + 1,5×IQR.
Вставка → График с областями и настройте вручную).Пример для наших данных о продажах:
- 25-й процентиль = 190.
- 75-й процентиль = 325.
- IQR = 325 − 190 = 135.
- Нижняя граница уса = 190 − 1,5×135 ≈ -21 (округляем до минимума, то есть 120).
- Верхняя граница уса = 325 + 1,5×135 ≈ 527 (округляем до максимума, то есть 500).
В Excel 2016 и новее есть встроенный тип диаграммы "Ящик с усами" (Вставка → Статистические графики), который автоматизирует этот процесс.
FAQ: Частые вопросы о процентилях в Excel
Можно ли рассчитать процентиль для неотсортированных данных?
Да, функции PERCENTILE автоматически упорядочивают данные перед расчётом. Однако для наглядности рекомендуется сортировать массив заранее.
Почему мои результаты отличаются от расчётов в статистических программах (например, R или Python)?
Разные программы используют различные методы интерполяции. Excel по умолчанию применяет метод "n+1" (для PERCENTILE.INC), в то время как в R используется метод 7 по умолчанию. Чтобы получить идентичные результаты, уточните метод в документации вашего ПО.
Как найти процентиль для сгруппированных данных (например, интервальные ряды)?
Для сгруппированных данных используйте формулу линейной интерполяции:
P = L + (w × (N×k - S)) / f
где:
L— нижняя граница интервала, содержащего процентиль,w— ширина интервала,N— общее число наблюдений,k— процентиль (в долях),S— накопленная частота до интервала,f— частота интервала.
Что делать, если функция возвращает #ЗНАЧ!?
Ошибка #ЗНАЧ! возникает, если:
- В массиве есть текст или логические значения (
ИСТИНА/ЛОЖЬ). - Аргумент
kне является числом.
Проверьте данные с помощью функции ТИП или фильтра.
Можно ли рассчитать процентиль для данных в нескольких столбцах?
Да, объедините столбцы в один массив. Например:
=PERCENTILE.INC((A2:A11; B2:B11); 0,5)
В Excel 365 и 2019 поддерживаются динамические массивы, поэтому можно использовать:
=PERCENTILE.INC((A2:A11, B2:B11); 0,5)