Квартили — это статистические показатели, которые делят упорядоченный набор данных на четыре равные части. Они широко используются в аналитике для оценки распределения значений: от финансовых отчетов до медицинских исследований. В Microsoft Excel расчет квартилей можно выполнить несколькими способами — от простых встроенных функций до ручных методов с использованием формул массива.
Многие пользователи путают квартиль с медианой (которая делит данные пополам) или перцентилем (деление на 100 частей). На практике первый квартиль (Q1) отделяет нижние 25% данных, второй (Q2) совпадает с медианой, а третий (Q3) — верхние 25%. Понимание этих нюансов критично для корректной интерпретации результатов, особенно при работе с большими массивами или выбросами.
В этой статье мы разберем 3 основных метода расчета квартилей в Excel, сравним функции QUARTILE, QUARTILE.INC и QUARTILE.EXC, а также покажем, как визуализировать результаты с помощью условного форматирования. Вы узнаете, какие ошибки чаще всего допускают новички и как их избежать.
Что такое квартиль и зачем он нужен
Квартиль — это значение, которое делит отсортированный массив данных на четыре равные части. Каждая часть содержит 25% наблюдений:
- 📊 Q1 (первый квартиль) — 25-й перцентиль, отделяет нижние 25% данных.
- 📈 Q2 (второй квартиль) — 50-й перцентиль, совпадает с медианой.
- 📉 Q3 (третий квартиль) — 75-й перцентиль, отделяет верхние 25% данных.
Например, если у вас есть данные о доходах 100 сотрудников, Q1 покажет пороговое значение, ниже которого зарабатывают 25 самых низкооплачиваемых работников. Это помогает выявить асимметрию распределения — например, когда большинство значений сконцентрировано в нижней части диапазона (правосторонняя асимметрия).
Квартили активно применяются в:
- 💰 Финансовом анализе (оценка рисков, доходности портфелей).
- 🏥 Медицине (нормальные диапазоны анализов крови).
- 📊 Маркетинге (сегментация клиентов по уровню траты).
- 🎓 Образовании (анализ успеваемости студентов).
⚠️ Внимание: Квартили чувствительны к выбросам! Если в данных есть экстремально высокие или низкие значения, они могут исказить результаты. В таких случаях лучше использовать усеченное среднее или медиану.
Способ 1: Функция QUARTILE (устаревшая, но рабочая)
Функция QUARTILE появилась в ранних версиях Excel и до сих пор поддерживается для обратной совместимости. Её синтаксис:
=QUARTILE(массив_данных; номер_квартиля)
Где номер_квартиля может принимать значения от 0 (минимум) до 4 (максимум). Например, для расчета Q1 используйте 1, для Q3 — 3.
Пример: Пусть у нас есть данные о продажах за 10 дней в ячейках A2:A11. Чтобы найти первый квартиль, введите:
=QUARTILE(A2:A11; 1)
| Данные (продажи) | Формула | Результат |
|---|---|---|
| 12, 15, 18, 20, 22, 25, 30, 35, 40, 50 | =QUARTILE(A2:A11; 1) | 19,25 |
| Те же данные | =QUARTILE(A2:A11; 3) | 33,75 |
⚠️ Внимание: Функция QUARTILE использует метод интерполяции для расчета. Это означает, что если квартиль попадает между двумя значениями, Excel вернет среднее арифметическое этих значений (как в примере выше: 19,25 — среднее между 18 и 20).
Основной недостаток этой функции — она не учитывает крайние значения (минимум и максимум) при расчете Q1 и Q3. Для более точных вычислений рекомендуется использовать QUARTILE.INC или QUARTILE.EXC.
Способ 2: Функции QUARTILE.INC и QUARTILE.EXC
В Excel 2010 и новее появились две уточненные функции:
- 🔹
QUARTILE.INC— включает крайние значения (минимум и максимум) в расчет. - 🔹
QUARTILE.EXC— исключает крайние значения (использует диапазон от Q1 до Q3).
Синтаксис у них идентичный:
=QUARTILE.INC(массив_данных; номер_квартиля)
=QUARTILE.EXC(массив_данных; номер_квартиля)
Ключевые различия:
| Функция | Включает крайние значения | Диапазон номер_квартиля | Пример Q1 для данных 1..10 |
|---|---|---|---|
QUARTILE | Нет | 0–4 | 3,25 |
QUARTILE.INC | Да | 0–4 | 3 |
QUARTILE.EXC | Нет | 1–3 | 3,5 |
На практике QUARTILE.EXC чаще используется в академических исследованиях, где важно исключить влияние выбросов. Например, для данных {5, 10, 15, 20, 25, 30, 35, 40, 45, 100}:
QUARTILE.INCвернет Q3 = 42,5 (учитывает 100).QUARTILE.EXCвернет Q3 = 37,5 (игнорирует 100).
Подготовьте данные (удалите пустые ячейки и текст)
Отсортируйте массив по возрастанию
Выберите подходящую функцию (INC или EXC)
Проверьте результат на адекватность (нет ли выбросов)-->
Способ 3: Ручной расчет с помощью PERCENTILE
Если вам нужно больше контроля над методом расчета, используйте функцию PERCENTILE (или PERCENTILE.INC/PERCENTILE.EXC). Она позволяет задать точный перцентиль:
=PERCENTILE(массив_данных; 0,25) // Q1
=PERCENTILE(массив_данных; 0,75) // Q3
Преимущества метода:
- 🎯 Точность: вы сами указываете долю (0,25 для Q1, 0,75 для Q3).
- 🔄 Гибкость: можно рассчитать любой перцентиль (например, 90-й для анализа верхних 10%).
- 📊 Совместимость: работает во всех версиях Excel.
Пример: Для массива {10, 20, 30, 40, 50, 60, 70, 80, 90, 100}:
=PERCENTILE(A2:A11; 0,25) // Вернет 32,5 (Q1)
=PERCENTILE(A2:A11; 0,75) // Вернет 77,5 (Q3)
Обратите внимание, что PERCENTILE также использует интерполяцию. Если вам нужно целое значение, округлите результат с помощью ROUND:
=ROUND(PERCENTILE(A2:A11; 0,25); 0)
Как Excel рассчитывает интерполяцию?
Excel использует формулу: Q = x1 + (k * (x2 - x1)), где:
- x1 — нижнее значение в интервале,
- x2 — верхнее значение в интервале,
- k — доля позиции квартиля между x1 и x2.
Например, для Q1 в массиве {10,20,30,40} позиция = 1,75 → результат = 20 + 0,75*(30-20) = 27,5.
Визуализация квартилей: ящик с усами (Box Plot)
Квартили — основа для построения диаграммы "ящик с усами" (Box Plot), которая визуализирует распределение данных. В Excel её можно создать вручную:
- Рассчитайте Q1, медиану (Q2) и Q3 с помощью любых методов выше.
- Найдите минимум и максимум (или используйте
MIN/MAX). - Вычислите нижнюю и верхнюю границы "усов":
=Q1 - 1,5*(Q3-Q1) // Нижняя граница=Q3 + 1,5*(Q3-Q1) // Верхняя граница
- Постройте
Диаграмму с областями(вкладкаВставка) и настройте данные вручную.
Пример данных для Box Plot:
| Показатель | Значение |
|---|---|
| Минимум | 10 |
| Q1 | 22,5 |
| Медиана (Q2) | 35 |
| Q3 | 57,5 |
| Максимум | 100 |
Для автоматизации процесса можно использовать надстройку Analysis ToolPak (вкладка Файл → Параметры → Надстройки). Она содержит инструмент Описательная статистика, который сразу строит Box Plot.
⚠️ Внимание: Если в данных есть выбросы (значения за пределами "усов"), их обычно отображают отдельными точками. В Excel это придется делать вручную или с помощью VBA.
Типичные ошибки и как их избежать
Даже опытные пользователи Excel допускают ошибки при расчете квартилей. Вот самые распространенные:
- Несортированные данные. Квартили рассчитываются для упорядоченного массива. Если данные не отсортированы, результат будет некорректным.
⚠️ Внимание: Всегда используйте
Сортировку от минимального к максимальному(вкладкаДанные → Сортировка) перед расчетом. - Пустые ячейки или текст. Функции
QUARTILEигнорируют нечисловые значения, но это может исказить результат. Очистите массив с помощью=IF(ISNUMBER(A2:A11); A2:A11; ""). - Неправильный выбор функции.
QUARTILE.EXCне работает с массивами меньше 4 элементов, аQUARTILE.INCможет давать неожиданные результаты для маленьких выборок. - Игнорирование выбросов. Если в данных есть экстремальные значения, используйте
TRIMMEANдля усечения или удалите выбросы вручную.
Как проверить корректность расчета? Сравните результат Excel с ручным подсчетом:
- Отсортируйте данные.
- Найдите позиции:
Позиция Q1 = (n + 1) * 0,25Позиция Q3 = (n + 1) * 0,75
где
n— количество элементов. - Если позиция дробная, возьмите среднее между соседними значениями.
Продвинутые методы: Квартили для группированных данных
Если ваши данные разбиты на группы (например, продажи по регионам), можно рассчитывать квартили для каждой группы отдельно. Для этого используйте:
- 🔹 Функции массива (для Excel 2019 и новее):
=BYROW(группы; LAMBDA(группа; QUARTILE.INC(группа; 1))) - 🔹 Сводные таблицы + пользовательские вычисления (вкладка
Анализ → Поля, элементы и наборы → Вычисления). - 🔹 Power Query (вкладка
Данные → Получить данные → Из таблицы/диапазона).
Пример с Power Query:
- Загрузите данные в Power Query (
Данные → Получить данные → Из таблицы). - Выберите столбец с группами, затем
Преобразование → Группировка. - В новом столбце используйте
Статистика → Квартиль(доступно в последних версиях).
Для Excel 2016 и старше подойдет комбинация INDEX + MATCH:
=QUARTILE.INC(INDEX(данные; MATCH(группа; группы; 0); 0); 1)
| Регион | Продажи | Q1 (по региону) |
|---|---|---|
| Москва | 100, 120, 150, 80, 200 | 105 |
| Питер | 50, 60, 70, 80, 90 | 57,5 |
FAQ: Ответы на частые вопросы
🔍 Почему мои квартили не совпадают с результатами в SPSS/R?
Разные программы используют различные методы интерполяции. Excel по умолчанию применяет метод Туки (включая крайние значения), тогда как SPSS может использовать метод Хайндмана-Фанга. Чтобы унифицировать результаты, используйте QUARTILE.EXC или настройте параметры в статистическом ПО.
📉 Как рассчитать межквартильный размах (IQR)?
Межквартильный размах — это разница между Q3 и Q1. Формула:
=QUARTILE.INC(массив; 3) - QUARTILE.INC(массив; 1)
IQR показывает разброс средних 50% данных и используется для выявления выбросов.
🔄 Можно ли рассчитать квартиль для несмежных данных?
Да, но нужно объединить ячейки в массив. Например, для диапазонов A2:A10 и C2:C10:
=QUARTILE.INC((A2:A10, C2:C10); 1)
В Excel 365 это работает нативно. В старых версиях используйте CTRL+SHIFT+ENTER для ввода формулы массива.
📊 Как построить гистограмму с квартилями?
Сначала рассчитайте квартили, затем:
- Постройте гистограмму (
Вставка → Гистограмма). - Добавьте линии квартилей:
Макет → Линии → Дополнительные вертикальные линии. - Укажите значения Q1, Q2, Q3 в качестве точек для линий.
💡 Почему QUARTILE.EXC возвращает ошибку #NUM?
Ошибка возникает, если в массиве меньше 4 значений. QUARTILE.EXC требует хотя бы 4 элемента для корректного расчета (исключая минимум и максимум). Используйте QUARTILE.INC или увеличьте выборку.