Что такое квинтили и зачем их считать в Excel
Квинтили — это статистические показатели, которые делят упорядоченный набор данных на пять равных частей (каждая по 20%). Они помогают анализировать распределение значений: от минимальных до максимальных, выявляя закономерности в больших массивах. Например, в маркетинге квинтили используют для сегментации клиентов по уровню дохода, а в финансах — для оценки рисков портфеля инвестиций.
В отличие от квартилей (которые делят данные на 4 части), квинтили дают более детализированное представление о распределении. Если вы работаете с данными о продажах, зарплатах или академической успеваемости, расчёт квинтилей в Microsoft Excel или Google Sheets позволит выявить скрытые группы с экстремально высокими или низкими значениями, которые квартили могли бы "замаскировать".
В этой статье вы узнаете:
- 🔹 Как рассчитать квинтили с помощью функции
ПЕРСЕНТИЛЬ.ВКЛ(самый точный метод) - 🔹 Альтернативные способы:
КВАРТИЛЬи ручная сортировка - 🔹 Как визуализировать квинтили на графиках (гистограммы, ящики с усами)
- 🔹 Типичные ошибки и как их избежать (например, почему
ПЕРСЕНТИЛЬ.ИСКЛдаёт другие результаты)
Метод 1: Функция ПЕРСЕНТИЛЬ.ВКЛ — самый надёжный способ
Функция ПЕРСЕНТИЛЬ.ВКЛ (в английской версии — PERCENTILE.INC) специально разработана для расчёта перцентилей, включая квинтили. Она возвращает значение, ниже которого находится заданный процент наблюдений (в нашем случае — 20%, 40%, 60%, 80%).
Синтаксис функции:
=ПЕРСЕНТИЛЬ.ВКЛ(массив_данных; k)
где k — это доля квинтиля (0.2, 0.4, 0.6, 0.8). Например, для первого квинтиля (20%) формула будет:
=ПЕРСЕНТИЛЬ.ВКЛ(A2:A100; 0,2)
Пример расчёта для массива данных о зарплатах сотрудников (см. таблицу ниже):
| Квинтиль | Формула | Значение (руб.) | Интерпретация |
|---|---|---|---|
| 1-й (20%) | =ПЕРСЕНТИЛЬ.ВКЛ(B2:B51; 0,2) |
45 000 | 20% сотрудников получают ≤ 45 000 руб. |
| 2-й (40%) | =ПЕРСЕНТИЛЬ.ВКЛ(B2:B51; 0,4) |
68 500 | 40% сотрудников получают ≤ 68 500 руб. |
| 3-й (60%) | =ПЕРСЕНТИЛЬ.ВКЛ(B2:B51; 0,6) |
92 000 | 60% сотрудников получают ≤ 92 000 руб. |
| 4-й (80%) | =ПЕРСЕНТИЛЬ.ВКЛ(B2:B51; 0,8) |
120 000 | 80% сотрудников получают ≤ 120 000 руб. |
Важно: Функция ПЕРСЕНТИЛЬ.ВКЛ включает минимальное и максимальное значения в расчёт, в отличие от ПЕРСЕНТИЛЬ.ИСКЛ, которая их игнорирует. Для квинтилей рекомендуется использовать ПЕРСЕНТИЛЬ.ВКЛ, так как она даёт более репрезентативные результаты для большинства задач.
Сортировать данные по возрастанию|Удалить пустые ячейки|Проверить отсутствие текстовых значений|Убедиться, что диапазон включает все данные-->
Метод 2: Функция КВАРТИЛЬ — альтернатива с ограничениями
Если в вашей версии Excel нет функции ПЕРСЕНТИЛЬ.ВКЛ (например, в Excel 2007 или более ранних), можно использовать КВАРТИЛЬ (англ. QUARTILE). Однако этот метод требует ручной корректировки, так как функция изначально рассчитана на 4 части (квартили), а не на 5 (квинтили).
Формула для расчёта квинтилей через КВАРТИЛЬ:
=КВАРТИЛЬ(массив_данных; (k*4)/5)
где k — номер квинтиля (1, 2, 3 или 4). Например, для 3-го квинтиля:
=КВАРТИЛЬ(A2:A100; 3*4/5) → =КВАРТИЛЬ(A2:A100; 2,4)
Проблема метода: Функция КВАРТИЛЬ округляет второй аргумент до ближайшего целого, что может искажать результаты. Например, для 1-го квинтиля (k=1) формула преобразуется в =КВАРТИЛЬ(..., 0.8), но Excel округлит 0.8 до 1, и вы получите значение 1-го квартиля вместо 1-го квинтиля.
⚠️ Внимание: ИспользуйтеКВАРТИЛЬдля квинтилей только если нет альтернативы. Для точных расчётов лучше обновите Excel до версии 2010+ или используйте Google Sheets, где естьPERCENTILE.INC.
Почему КВАРТИЛЬ даёт неточные квинтили?
Функция КВАРТИЛЬ изначально предназначена для деления данных на 4 части, а не на 5. При расчёте квинтилей она forcedly округляет дробные значения второго аргумента (например, 0.8 → 1), что приводит к смещению результатов в сторону квартилей. Например, вместо 1-го квинтиля (20%) вы можете получить значение, близкое к 1-му квартилю (25%).
Метод 3: Ручной расчёт через сортировку и ПРОЦЕНТРАНГ
Если вам нужно не только найти границы квинтилей, но и определить, к какому квинтилю относится каждое значение в наборе данных, используйте комбинацию сортировки и функции ПРОЦЕНТРАНГ (англ. PERCENTRANK). Этот метод полезен для сегментации клиентов или анализа распределения.
Алгоритм:
- Отсортируйте данные по возрастанию (в меню:
Данные → Сортировка). - Добавьте столбец с формулой
=ПРОЦЕНТРАНГ.ВКЛ($A$2:$A$100; A2), где$A$2:$A$100— диапазон данных, аA2— текущая ячейка. - На основе результата
ПРОЦЕНТРАНГприсвойте квинтиль по правилу:- 🔢 ≤ 0.2 → 1-й квинтиль
- 🔢 0.21–0.4 → 2-й квинтиль
- 🔢 0.41–0.6 → 3-й квинтиль
- 🔢 0.61–0.8 → 4-й квинтиль
- 🔢 > 0.8 → 5-й квинтиль
Пример таблицы с сегментацией клиентов по сумме покупок:
| Клиент | Сумма покупок (руб.) | ПРОЦЕНТРАНГ | Квинтиль |
|---|---|---|---|
| Иванов А.П. | 1 200 | 0.05 | 1 |
| Петрова Е.С. | 3 500 | 0.30 | 2 |
| Сидоров К.Л. | 8 900 | 0.55 | 3 |
| Алексеева М.Д. | 15 000 | 0.85 | 5 |
=ЕСЛИ(P2<=0,2; 1; ЕСЛИ(P2<=0,4; 2; ЕСЛИ(P2<=0,6; 3; ЕСЛИ(P2<=0,8; 4; 5))))
где P2 — ячейка с результатом ПРОЦЕНТРАНГ.-->
Визуализация квинтилей: графики и диаграммы
Квинтили удобно представлять визуально, особенно при сравнении нескольких групп данных. В Excel для этого подходят:
- 📊 Гистограмма с накоплением: Показывает распределение значений по квинтилям. Используйте
Вставка → Гистограмма → Гистограмма с накоплением. - 📈 Ящик с усами (Box Plot): Отображает медиану, квартили и квинтили. В Excel нет встроенного Box Plot, но его можно эмулировать через
Вставка → Точечная диаграммас ручной настройкой. - 🔶 Тепловая карта: Подсвечивает ячейки разными цветами в зависимости от квинтиля (используйте
Условное форматирование → Цветовые шкалы).
Пример настройки Box Plot для квинтилей:
- Рассчитайте квинтили и квартили для ваших данных.
- Создайте вспомогательную таблицу с значениями:
- Минимум
- 1-й квинтиль (20%)
- 1-й квартиль (25%)
- Медиана (50%)
- 3-й квартиль (75%)
- 4-й квинтиль (80%)
- Максимум
⚠️ Внимание: В Excel 2016+ есть встроенный тип диаграммы "Ящик с усами", но он показывает только квартили (25%, 50%, 75%). Чтобы отобразить квинтили, придётся вручную добавлять линии для 20% и 80% через Формат ряда данных → Добавить линию.
Типичные ошибки и как их избежать
При расчёте квинтилей в Excel даже опытные пользователи допускают ошибки. Вот самые распространённые:
- Несортированные данные: Функции
ПЕРСЕНТИЛЬ.ВКЛиКВАРТИЛЬработают корректно только с отсортированными по возрастанию данными. Если массив не упорядочен, результаты будут неверными.⚠️ Внимание: Перед расчётом всегда применяйте сортировку: выделите диапазон →
Данные → Сортировка от минимального к максимальному. - Пустые ячейки или текст: Если в диапазоне есть пустые ячейки или нечисловые значения (например, "#Н/Д"), Excel проигнорирует их, но это исказит итоговый процент. Например, если из 100 ячеек 5 пустых, функция будет рассчитывать квинтили для 95 значений, а не для 100.
- Использование ПЕРСЕНТИЛЬ.ИСКЛ вместо ПЕРСЕНТИЛЬ.ВКЛ: Функция
ПЕРСЕНТИЛЬ.ИСКЛисключает минимальное и максимальное значения, что может быть критично для небольших выборок. Например, в массиве из 10 значений исключение двух крайних приведёт к расчёту квинтилей для 8 значений вместо 10. - 🔢 Отсортируйте данные.
- 🔢 Найдите позиции квинтилей:
позиция = (количество_значений * k) + 1, гдеk— номер квинтиля (0.2, 0.4, 0.6, 0.8). - 🔢 Если позиция дробная, интерполируйте между соседними значениями.
- 🔄 Динамические диапазоны: Замените статичные ссылки (например,
A2:A100) на именованные диапазоны или таблицы Excel. Тогда при добавлении новых данных квинтили будут пересчитываться автоматически. - 🔧 Power Query: В
Данные → Получить данные → Из таблицы/диапазоназагрузите данные в Power Query и используйте язык M для расчёта квинтилей:letSource = Excel.CurrentWorkbook(){[Name="Таблица1"]}[Content],
Sorted = Table.Sort(Source,{{"Значение", Order.Ascending}}),
Quintiles = {
List.Min(Sorted[Значение]),
List.Percentile(Sorted[Значение], 0.2),
List.Percentile(Sorted[Значение], 0.4),
List.Percentile(Sorted[Значение], 0.6),
List.Percentile(Sorted[Значение], 0.8),
List.Max(Sorted[Значение])
}
in
Quintiles
- 📊 DAX в Power Pivot: Если вы работаете с большими данными, используйте меру DAX:
Квинтиль 1 =PERCENTILE.INC(Таблица[Столбец]; 0.2)
Чтобы проверить корректность расчётов, сравните результаты с ручным методом:
Как интерполировать квинтили вручную?
Если позиция квинтиля дробная (например, 10.6 для массива из 50 значений), найдите два соседних значения в отсортированном массиве:
- Значение на позиции 10: 45 000 руб.
- Значение на позиции 11: 47 000 руб.
Затем рассчитайте интерполированное значение:
45 000 + (47 000 - 45 000) * 0.6 = 46 200 руб.
Это и будет точная граница квинтиля.
Продвинутые приёмы: динамические квинтили и Power Query
Если вам нужно рассчитывать квинтили для часто обновляемых данных (например, ежемесячных продаж), используйте динамические формулы или Power Query:
Для автоматизации отчётности можно создать сводную таблицу с группировкой по квинтилям:
- Добавьте столбец с квинтилями (как в Методе 3).
- Создайте сводную таблицу (
Вставка → Сводная таблица). - Перетащите столбец с квинтилями в область "Строки", а анализируемое значение (например, "Продажи") — в область "Значения".
- Настройте отображение среднего, суммы или количества записей для каждого квинтиля.
FAQ: Частые вопросы о квинтилях в Excel
❓ Можно ли рассчитать квинтили для несортированных данных?
Технически функции ПЕРСЕНТИЛЬ.ВКЛ и КВАРТИЛЬ работают и с несортированными данными, так как Excel внутренне упорядочивает их перед расчётом. Однако рекомендуется сортировать данные вручную, чтобы избежать ошибок при наличии пустых ячеек или нечисловых значений. Кроме того, сортировка позволяет визуально проверить корректность результатов.
❓ В чём разница между ПЕРСЕНТИЛЬ.ВКЛ и ПЕРСЕНТИЛЬ.ИСКЛ?
Функция ПЕРСЕНТИЛЬ.ВКЛ (англ. PERCENTILE.INC) включает минимальное и максимальное значения массива в расчёт, а ПЕРСЕНТИЛЬ.ИСКЛ (англ. PERCENTILE.EXC) — исключает их. Это приводит к разным результатам для небольших выборок. Например, для массива [10, 20, 30, 40, 50]:
ПЕРСЕНТИЛЬ.ВКЛ(..., 0.2)вернёт18(интерполированное значение между 10 и 20).ПЕРСЕНТИЛЬ.ИСКЛ(..., 0.2)вернёт22(интерполированное значение между 20 и 30, так как 10 и 50 исключены).
Для квинтилей обычно используют ПЕРСЕНТИЛЬ.ВКЛ, так как он даёт более консервативные оценки.
❓ Как рассчитать квинтили для сгруппированных данных (например, по регионам)?
Если данные сгруппированы (например, продажи по регионам), используйте один из методов:
- Отдельные столбцы: Создайте отдельные столбцы с квинтилями для каждой группы (например, "Квинтиль_Москва", "Квинтиль_СПб") и применяйте
ПЕРСЕНТИЛЬ.ВКЛк фильтрованным диапазонам. - Сводные таблицы: Добавьте столбец с квинтилями для всего массива, затем создайте сводную таблицу с группировкой по региону и квинтилю.
- Power Query: Сгруппируйте данные по региону (
Table.Group), затем рассчитайте квинтили для каждой группы отдельно.
Пример формулы для региона "Москва" (предполагаем, что регионы указаны в столбце A, а значения — в B):
=ПЕРСЕНТИЛЬ.ВКЛ(ЕСЛИ($A$2:$A$100="Москва"; $B$2:$B$100); 0,2)
Важно: Это формула массива — введите её с Ctrl+Shift+Enter в старых версиях Excel.
❓ Почему мои квинтили не совпадают с результатами в статистических программах (R, Python)?
Разница может возникать из-за:
- 🔹 Метода интерполяции: Excel использует линейную интерполяцию между соседними значениями, а некоторые программы (например, R с параметром
type=7) применяют другие алгоритмы. - 🔹 Обработки повторяющихся значений: При наличии дубликатов Excel может округлять позиции иначе, чем специализированные пакеты.
- 🔹 Исключения крайних значений: Проверьте, используете ли вы
ПЕРСЕНТИЛЬ.ВКЛилиПЕРСЕНТИЛЬ.ИСКЛ.
Для совместимости с R или Python используйте в Excel метод ручной интерполяции (см. спойлер выше).
❓ Как автоматизировать расчёт квинтилей для новых данных?
Чтобы квинтили обновлялись автоматически при добавлении новых строк:
- Преобразуйте диапазон данных в таблицу Excel (
Вставка → ТаблицаилиCtrl+T). - Используйте структурированные ссылки в формулах. Например, если таблица называется
Данные, а столбец —Значение, формула будет:=ПЕРСЕНТИЛЬ.ВКЛ(Данные[Значение]; 0,2) - Для динамической визуализации свяжите графики с именованными диапазонами или таблицами.
Альтернатива: используйте Power Query для автоматической обработки новых данных при обновлении.