Как рассчитать доверительный интервал в Excel: формулы, примеры и шаблоны

Почему доверительный интервал важен и где его применяют

Доверительный интервал (ДИ) — это статистический диапазон, который с заданной вероятностью (например, 95% или 99%) содержит истинное значение параметра генеральной совокупности. Без него невозможно оценить точность ваших данных: среднее по выборке всегда отличается от среднего по всей совокупности, и ДИ показывает, насколько сильно это отличие может быть.

Где это используется на практике? В маркетинге — для оценки конверсии по выборке клиентов, в медицине — для анализа эффективности лекарств, в производстве — для контроля качества партий товара. Даже в повседневных задачах: если вы опросили 100 человек из 10 000 и получили средний чек 500 рублей, ДИ подскажет, что реальный средний чек для всех клиентов с вероятностью 95% лежит, например, между 480 и 520 рублями. Без Excel такие расчёты занимают часы — а с ним достаточно нескольких кликов.

В этой статье вы научитесь:

  • 🔹 Вычислять ДИ для среднего (одна выборка) с известным и неизвестным стандартным отклонением.
  • 🔹 Сравнивать два средних значения (две выборки) — например, до и после изменения процесса.
  • 🔹 Использовать функции ДОВЕРИТ(), НОРМ.ОБР(), СТЬЮДЕНТ.ОБР.2Х() без ошибок.
  • 🔹 Визуализировать ДИ на графиках — чтобы презентовать результаты коллегам или руководству.
📊 Для чего вам нужен доверительный интервал?
Для научной работы
Для бизнес-анализа
Для учебного проекта
Для личных расчётов
Другое

Подготовка данных: что нужно знать до расчётов

Прежде чем открывать Excel, ответьте на три ключевых вопроса:

  1. Какая у вас выборка? Если данных меньше 30 (малая выборка), используйте t-распределение Стьюдента (функция СТЬЮДЕНТ.ОБР.2Х()). Если больше — нормальное распределение (НОРМ.ОБР()).
  2. Знаете ли вы стандартное отклонение генеральной совокупности? Если да — используйте Z-критерий (функция ДОВЕРИТ.НОРМ() в новых версиях Excel). Если нет — t-критерий.
  3. Какой уровень доверия нужен? Стандарт — 95% (альфа = 0.05), но для критичных задач (например, медицинских исследований) берут 99% (альфа = 0.01).

Пример структуры данных для расчёта ДИ среднего роста студентов:

СтудентРост (см)
Иванов178
Петрова165
Сидоров182
......
Среднее=СРЗНАЧ(B2:B101)
Ст. отклонение=СТАНДОТКЛОН.В(B2:B101)
⚠️ Внимание: Если ваши данные содержат выбросы (например, рост 200 см при среднем 175 см), ДИ будет завышен. Перед расчётом проверьте выборку на аномалии с помощью правила трёх сигм или боксплота (в Excel 2016+ есть встроенная диаграмма "Ящик с усами").

Формула доверительного интервала для одной выборки

Базовая формула ДИ для среднего (μ) выглядит так:

ДИ = x̄ ± t*(s/√n), где:

  • 📌 — среднее выборки (=СРЗНАЧ());
  • 📌 t — критическое значение (из функции СТЬЮДЕНТ.ОБР.2Х() или НОРМ.ОБР());
  • 📌 s — стандартное отклонение выборки (=СТАНДОТКЛОН.В());
  • 📌 n — размер выборки.

В Excel 2019+ есть готовая функция ДОВЕРИТ() (или ДОВЕРИТ.НОРМ() для нормального распределения), но она работает только если известно стандартное отклонение генеральной совокупности. Для реальных задач чаще используют t-распределение:

=СРЗНАЧ(диапазон) ± СТЬЮДЕНТ.ОБР.2Х(1-уровень_доверия; степень_свободы) * (СТАНДОТКЛОН.В(диапазон)/КОРЕНЬ(СЧЁТ(диапазон)))

Пример для выборки из 25 студентов (уровень доверия 95%):

=175 ± СТЬЮДЕНТ.ОБР.2Х(0,05; 24) * (6,2/КОРЕНЬ(25))

Исключены выбросы из данных|Определён тип распределения (нормальное/t-Стьюдента)|Указан правильный уровень доверия (альфа)|Посчитано стандартное отклонение выборки-->

⚠️ Внимание: Функция СТЬЮДЕНТ.ОБР.2Х() возвращает двухстороннее критическое значение. Если вам нужно одностороннее (например, для проверки гипотезы "больше чем"), используйте СТЬЮДЕНТ.ОБР() с одним хвостом.

Практические примеры: шаг за шагом

Пример 1: ДИ для среднего времени доставки (малая выборка)

Задача: Оценить среднее время доставки пиццы по выборке из 15 заказов. Данные (в минутах): 28, 32, 30, 25, 35, 29, 31, 27, 33, 26, 30, 28, 32, 29, 31.

Решение:

  1. Введите данные в столбец A1:A15.
  2. Посчитайте среднее: =СРЗНАЧ(A1:A15) → 29,8 минут.
  3. Посчитайте стандартное отклонение: =СТАНДОТКЛОН.В(A1:A15) → 2,76.
  4. Найдите критическое значение t для 95% ДИ (альфа=0,05, степени свободы=14): =СТЬЮДЕНТ.ОБР.2Х(0,05;14) → 2,145.
  5. Рассчитайте погрешность: =2,145*(2,76/КОРЕНЬ(15)) → 1,56.
  6. Итоговый ДИ: 29,8 ± 1,56 → от 28,24 до 31,36 минут.

Пример 2: ДИ для доли (процента) ответивших на опрос

Задача: В опросе участвовало 500 человек, 320 ответили "Да". Найти 99%-ный ДИ для доли положительных ответов.

Формула для доли: ДИ = p ± Z*√(p*(1-p)/n), где p — доля успехов (320/500=0,64), Z — критическое значение нормального распределения.

В Excel:

=0,64 ± НОРМ.ОБР(0,995)КОРЕНЬ(0,64(1-0,64)/500)

Результат: 0,64 ± 0,065 → ДИ от 57,5% до 70,5%.

Сравнение двух средних: ДИ для разницы

Частая задача — сравнить средние двух выборок. Например, оценить, насколько новый алгоритм рекомендаций увеличивает средний чек по сравнению со старым. Здесь ДИ строится для разницы средних.

Формула:

ДИ(μ₁ − μ₂) = (x̄₁ − x̄₂) ± t*√(s₁²/n₁ + s₂²/n₂)

Пример: Сравним средний чек до (A1:A30, x̄₁=1200 руб, s₁=150) и после (B1:B30, x̄₂=1350 руб, s₂=180) изменений. Уровень доверия 90% (альфа=0,10).

Шаги:

  1. Разница средних: 1350 - 1200 = 150 руб.
  2. Критическое значение t (степени свободы ≈ min(n₁-1, n₂-1)=29): =СТЬЮДЕНТ.ОБР.2Х(0,1;29) → 1,699.
  3. Стандартная ошибка разницы: =КОРЕНЬ(150^2/30 + 180^2/30) → 45,6.
  4. ДИ: 150 ± 1,699*45,6 → от 68 до 232 руб.

Вывод: С вероятностью 90% реальная разница средних чеков лежит в диапазоне 68–232 руб. Если этот интервал не включает 0, разница статистически значима.

Что делать, если выборки разного размера?

Если n₁ ≠ n₂, используйте приближённую формулу степеней свободы Уэлча:

= (s₁²/n₁ + s₂²/n₂)² / ( (s₁²/n₁)²/(n₁-1) + (s₂²/n₂)²/(n₂-1) )

Этот метод точнее, чем просто брать min(n₁-1, n₂-1).

Визуализация доверительного интервала

График с ДИ делает ваши данные наглядными и убедительными. В Excel это можно реализовать двумя способами:

Способ 1: График "Среднее ± погрешность"

  1. Создайте таблицу с данными (например, средние продажи по месяцам) и столбцами Нижняя граница ДИ и Верхняя граница ДИ.
  2. Постройте линейчатую диаграмму для средних значений.
  3. Добавьте линии погрешностей: Конструктор → Добавить элемент диаграммы → Погрешности → Стандартная ошибка.
  4. Настройте погрешности вручную: укажите диапазоны для нижней и верхней границ.

Способ 2: Лепестковая диаграмма (для сравнения групп)

Подходит для визуализации ДИ нескольких групп (например, сравнение регионов по доходу).

  • 📊 Используйте точечную диаграмму с горизонтальными линиями погрешностей.
  • 📊 Для каждой группы добавьте две точки: среднее значение и полуширину ДИ.
  • 📊 Настройте формат линий погрешностей, чтобы они отображали полный интервал.

Пример визуализации ДИ для среднего чека по 3 городам:

ГородСредний чекНижняя граница ДИВерхняя граница ДИ
Москва150014501550
СПб130012401360
Казань110010501150
⚠️ Внимание: Если ваши ДИ на графике пересекаются, это НЕ означает, что разница между группами незначима! Для точного вывода используйте тест гипотез (например, t-тест в Анализе данных).

Распространённые ошибки и как их избежать

Даже опытные аналитики допускают ошибки при расчёте ДИ. Вот топ-5 ловушек:

  1. Использование Z-распределения для малой выборки (n < 30). Всегда проверяйте размер выборки: для n < 30 берите t-распределение, даже если данные выглядят "нормальными".
  2. Путаница между стандартным отклонением выборки и генеральной совокупности. Функция ДОВЕРИТ() требует сигму совокупности (σ), а у вас обычно есть только s (выборочное).
  3. Игнорирование зависимых выборок. Если вы сравниваете данные "до" и "после" для одних и тех же объектов (например, вес пациентов до и после диеты), используйте парный t-тест, а не независимые ДИ.
  4. Некорректный уровень доверия. Для медицинских исследований часто требуется 99%, а не 95%. Уточняйте требования заранее!
  5. Отсутствие проверки на нормальность. Если данные не нормальны (проверьте тестом Шапиро-Уилка или визуально по гистограмме), ДИ для среднего может быть некорректен. Используйте непараметрические методы (например, бутстреп).

1) Размер выборки (n ≥ 30?),

2) Тип данных (непрерывные/бинарные),

3) Распределение (нормальное или нет).

Это сэкономит часы на переделку анализа.-->

FAQ: Ответы на частые вопросы

Можно ли рассчитать ДИ для медианы в Excel?

В стандартном Excel нет функции для ДИ медианы, но можно использовать:

  1. Бутстреп-метод: Создайте 1000 случайных подвыборок с возвращением, посчитайте медиану для каждой и найдите 2,5-й и 97,5-й перцентили (для 95% ДИ).
  2. Формулу для порядковых статистик: Для большой выборки ДИ медианы ≈ =МЕДИАНА ± 1,25*МАД/√n, где МАД — среднее абсолютное отклонение.

В Excel 365 для бутстрепа удобно использовать функции СЛУЧМЕЖДУ() и ПЕРСЕНТИЛЬ.ВКЛ().

Как рассчитать ДИ для дисперсии?

Для дисперсии (σ²) используйте хи-квадрат распределение. Формулы:

Нижняя граница: =(n-1)*S² / ХИ2.ОБР(альфа/2; n-1)

Верхняя граница: =(n-1)*S² / ХИ2.ОБР(1-альфа/2; n-1)

Где — выборочная дисперсия (=ДИСП.В()), n — размер выборки.

Чем отличаются функции ДОВЕРИТ() и ДОВЕРИТ.НОРМ()?

В Excel 2019+ появилась функция ДОВЕРИТ.НОРМ(), которая:

  • 🔹 Использует Z-распределение (нормальное), а не t-Стьюдента.
  • 🔹 Требует стандартное отклонение генеральной совокупности (σ), а не выборки (s).
  • 🔹 Подходит только для больших выборок (n > 30) или когда σ известно заранее.

Старая функция ДОВЕРИТ() в новых версиях Excel стала алиасом для ДОВЕРИТ.НОРМ().

Как автоматизировать расчёт ДИ для большого количества групп?

Используйте Power Query или VBA:

  1. Power Query: Загрузите данные, сгруппируйте по категориям, добавьте столбцы со средним, стандартным отклонением и ДИ.
  2. VBA: Напишите макрос, который проходит по каждой группе, рассчитывает ДИ и записывает результаты в новую таблицу.

Пример кода VBA для ДИ среднего:

Function ConfInt(rng As Range, alpha As Double) As String

Dim mean As Double, stdev As Double, n As Integer, t As Double, margin As Double

mean = Application.WorksheetFunction.Average(rng)

stdev = Application.WorksheetFunction.StDevP(rng)

n = rng.Cells.Count

t = Application.WorksheetFunction.TInv2(alpha, n - 1)

margin = t * stdev / Sqr(n)

ConfInt = "Среднее: " & Round(mean, 2) & ", ДИ: [" & Round(mean - margin, 2) & "; " & Round(mean + margin, 2) & "]"

End Function

Где скачать готовый шаблон Excel для расчёта ДИ?

Готовые шаблоны с формулами и визуализацией:

Все шаблоны совместимы с Excel 2016+ и поддерживают динамические массивы.