Как перенести таблицу из PDF в Excel: полное руководство с примерами

Перенос данных из PDF-документов в Microsoft Excel или Google Sheets — задача, с которой регулярно сталкиваются бухгалтеры, аналитики и студенты. Проблема в том, что PDF изначально не предназначен для редактирования: это формат для фиксированного отображения контента, где таблицы часто представляют собой просто картинки или наборы текста без структуры. В результате при копировании ячеек "съезжают", числа превращаются в текст, а формулы исчезают вовсе.

В этой статье мы разберём 5 проверенных способов переноса таблиц — от ручного ввода (подходящего для небольших документов) до специализированных программ для автоматизации. Особое внимание уделим скрытым ловушкам PDF: почему некоторые таблицы копируются криво даже в платных конвертерах и как это исправить. Вы также узнаете, какие форматы PDF лучше всего поддаются конвертации, а какие требуют предварительной обработки.

Если вы работаете с отчётностью, научными данными или архивными документами, этот гайд сэкономит вам часы рутинной работы. Начнём с самого простого метода — и постепенно перейдём к продвинутым инструментам.

1. Ручной ввод: когда это оправдано

Да, копировать таблицу вручную — скучно и долго. Но в некоторых случаях это единственный надёжный способ. Например, если PDF содержит отсканированные изображения таблиц (без текстового слоя) или сложные многоуровневые заголовки, которые программы распознают с ошибками.

Ручной метод оправдан для:

  • 📄 Таблиц до 20 строк и 5 столбцов (на ввод уйдёт 10–15 минут)
  • 🔍 Документов с нестандартным форматированием (объединённые ячейки, диагональные линии)
  • 🔒 Конфиденциальных данных, которые нельзя загружать в онлайн-сервисы

Чтобы ускорить процесс:

  1. Откройте PDF в Adobe Acrobat Reader (бесплатная версия).
  2. Увеличьте масштаб до 200–300%, чтобы лучше видеть цифры.
  3. В Excel заранее настройте ширину столбцов под исходную таблицу (кликните правой кнопкой по букве столбца → Ширина столбца).
  4. Используйте горячие клавиши: Ctrl+C/Ctrl+V для копирования целых блоков, Alt+↓ для автозаполнения повторяющихся данных.
⚠️ Внимание: Если в таблице есть формулы (например, суммы по строкам), их придётся восстанавливать вручную — при копировании из PDF они теряются.

2. Копирование через буфер обмена (Ctrl+C → Ctrl+V)

Самый очевидный способ — выделить таблицу в PDF и вставить её в Excel. Но здесь есть подводные камни: результат зависит от того, как был создан PDF. Если документ сгенерирован из Word или другой программы с сохранением структуры, таблица вставится более-менее корректно. Если же PDF экспортирован из скана или создан через "Печать в PDF", данные скорее всего "поедут".

Пошаговая инструкция:

  • 📑 Откройте PDF в Adobe Acrobat Reader или Foxit Reader (бесплатные версии).
  • 🖱️ Нажмите на инструмент Выделение текста (обычно выглядит как курсор с буквой "T").
  • 🔳 Выделите таблицу целиком или по частям (удерживайте Shift для выделения нескольких фрагментов).
  • 📋 Скопируйте (Ctrl+C) и вставьте в Excel (Ctrl+V).

Что делать, если таблица вставила криво:

ПроблемаРешение
Данные в одной ячейкеИспользуйте Текст по столбцам (Данные → Текст по столбцам в Excel).
Числа стали текстомВыделите столбец → Формат ячеек → Числовой.
Пустые строки между даннымиОтсортируйте таблицу по любому столбцу, чтобы убрать пробелы.
Символы "?" вместо буквПоменяйте кодировку при вставке (попробуйте UTF-8).
⚠️ Внимание: Если при выделении таблицы в PDF курсор превращается в крестик (🞃), а не в стрелку — это значит, что таблица является изображением. Копирование через буфер не сработает; используйте методы из раздела 4.
📊 Какой программой вы чаще всего открываете PDF?
Adobe Acrobat Reader
Foxit Reader
Браузер (Chrome/Edge)
Предварительный просмотр (Mac)
Другая

3. Экспорт через Adobe Acrobat Pro (платный метод)

Если вы работаете с PDF регулярно, стоит рассмотреть Adobe Acrobat Pro (от $14.99/месяц). В отличие от бесплатного Reader, Pro-версия умеет экспортировать таблицы в Excel с сохранением структуры — включая объединённые ячейки и базовое форматирование.

Как это работает:

  • 📂 Откройте PDF в Adobe Acrobat Pro.
  • 🖥️ Перейдите в Файл → Экспорт в → Таблица Excel.
  • ⚙️ В настройках экспорта выберите:
    • 📊 Сохранить макет таблицы (для сложных таблиц)
    • 🔢 Распознавать числа (чтобы избежать текстового формата)
  • 💾 Сохраните файл и откройте в Excel.

Преимущества метода:

  • 🎯 Точность: правильно распознаёт до 95% таблиц (по тестам PCMag).
  • 🔄 Сохраняет формулы, если PDF создан из Excel.
  • 📁 Поддерживает пакетную обработку (экспорт нескольких таблиц за раз).

Недостатки:

  • 💰 Платная подписка (бесплатной версии с экспортом в Excel нет).
  • 🐢 Медленнее, чем онлайн-сервисы (обработка 50-страничного PDF может занять 5–10 минут).
Как получить Adobe Acrobat Pro бесплатно?

Студенты и преподаватели могут оформить бесплатную лицензию на 1 год через программу [Adobe Creative Cloud для учебных заведений](https://www.adobe.com/ru/creativecloud/buy/students.html). Также иногда проходят акции с бесплатным доступом на 7 дней.

4. Конвертация через онлайн-сервисы (бесплатно)

Если платить за Adobe Acrobat Pro не хочется, на помощь приходят онлайн-конвертеры. Они бесплатны, но имеют ограничения по размеру файла (обычно до 50 МБ) и количеству таблиц в месяц. Мы протестировали 10 сервисов — лучшие результаты показали Smallpdf, iLovePDF и PDF2Excel.

Пошаговая инструкция (на примере Smallpdf):

  1. Перейдите на [smallpdf.com/ru/pdf-to-excel](https://smallpdf.com/ru/pdf-to-excel).
  2. Загрузите файл с компьютера, Google Drive или Dropbox.
  3. Выберите опцию Преобразовать всю страницу или Выбрать область (если таблица на части страницы).
  4. Нажмите Преобразовать и скачайте результат.

Сравнение популярных сервисов:

СервисМакс. размер файлаСохраняет форматированиеОграничения
Smallpdf50 МБ80–90%2 задачи/день бесплатно
iLovePDF100 МБ70–85%Реклама в бесплатной версии
PDF2Excel30 МБ90%+Требует email для скачивания
CloudConvert1 ГБ75–80%Медленная обработка
⚠️ Внимание: Онлайн-сервисы не подходят для конфиденциальных данных (налоговые декларации, медицинские карты, НИОКР). Файлы загружаются на сторонние серверы и могут сохраняться там до 24 часов.

☑️ Подготовка PDF перед конвертацией

Выполнено: 0 / 4

5. Распознавание текста (OCR) для сканированных PDF

Если ваш PDF представляет собой отсканированный документ или фотографию таблицы, обычные методы копирования не сработают. Здесь поможет технология OCR (Optical Character Recognition — оптическое распознавание символов). Она преобразует изображение текста в редактируемые данные.

Лучшие инструменты с OCR:

  • 🖼️ Adobe Scan (мобильное приложение, бесплатно)
  • 💻 ABBYY FineReader (платный, но есть пробная версия)
  • 🌐 OnlineOCR.net (бесплатно, до 15 файлов в час)

Инструкция для ABBYY FineReader:

  1. Установите программу и откройте сканированный PDF.
  2. Выберите область с таблицей инструментом Выделение.
  3. Нажмите Распознать и дождитесь обработки (может занять 1–3 минуты).
  4. Экспортируйте результат в Excel или CSV.

Точность OCR зависит от качества скана:

  • 📸 300 DPI и выше — ошибки в 1–2 символа на страницу.
  • 📸 150–200 DPI — до 10% ошибок (придётся править вручную).
  • 📸 Ниже 150 DPI — распознавание практически бесполезно.

6. Автоматизация через Python (для продвинутых пользователей)

Если вам нужно обработать сотни PDF с таблицами, ручные методы не подойдут. В этом случае поможет скрипт на Python с библиотеками PyPDF2 (для извлечения текста) и pandas (для формирования таблиц).

Пример кода для извлечения таблицы из PDF:

import PyPDF2

import pandas as pd

Открываем PDF

with open('document.pdf', 'rb') as file:

reader = PyPDF2.PdfReader(file)

page = reader.pages[0] # Первая страница

text = page.extract_text()

Разбиваем текст на строки и столбцы (пример для простой таблицы)

data = [line.split() for line in text.split('\n') if line.strip()]

df = pd.DataFrame(data[1:], columns=data[0]) # Первая строка - заголовки

Сохраняем в Excel

df.to_excel('output.xlsx', index=False)

Для сложных таблиц (с объединёнными ячейками) лучше использовать camelot или tabula-py:

!pip install camelot-py[cv]

import camelot

tables = camelot.read_pdf('document.pdf', flavor='lattice', pages='1')

tables.export('output.xlsx', f='excel')

Плюсы автоматизации:

  • ⚡ Обработка тысяч страниц за минуты.
  • 🔧 Гибкая настройка под любой формат таблиц.
  • 📂 Интеграция с другими системами (например, загрузка прямо в 1C или Google Sheets).
⚠️ Внимание: Библиотеки camelot и tabula требуют установки Java и Ghostscript. Без них скрипты не будут работать.

Сравнение методов: какой выбрать?

Выбор способа зависит от типа PDF, сложности таблицы и ваших навыков. Вот краткая шпаргалка:

МетодЛучше всего дляТочностьСкоростьСтоимость
Ручной вводМаленькие таблицы (до 20 строк)100%МедленноБесплатно
Копирование (Ctrl+C)PDF из Word/Excel без изображений60–80%БыстроБесплатно
Adobe Acrobat ProСложные таблицы с формулами90–95%СреднеОт $15/месяц
Онлайн-сервисыPDF до 50 МБ, неконфиденциальные данные70–90%БыстроБесплатно (лимиты)
OCR (ABBYY, OnlineOCR)Сканированные документы80–95% (зависит от качества)МедленноОт $0 до $100
Python-скриптыМассовая обработка (100+ файлов)50–90% (требует настройки)Очень быстроБесплатно

Если вы не уверены, какой метод выбрать, начните с онлайн-сервисов (например, Smallpdf). Если результат неудовлетворительный — попробуйте Adobe Acrobat Pro или OCR.

FAQ: Частые вопросы

❓ Почему при копировании из PDF в Excel числа отображаются как даты (например, "1-12" вместо "1.12")?

Это происходит из-за автоматического форматирования Excel. Чтобы исправить:

  1. Выделите проблемный столбец.
  2. Перейдите в Формат ячеек → Числовой.
  3. Если не поможет, вставляйте данные через Специальная вставка → Текст.
❓ Можно ли скопировать таблицу из PDF в Google Sheets?

Да, все описанные методы работают и для Google Sheets. Самый простой способ:

  1. Скопируйте таблицу из PDF (Ctrl+C).
  2. Вставьте в Google Sheets (Ctrl+V).
  3. Если данные вставили в одну ячейку, используйте функцию =SPLIT() для разделения по разделителю (например, =SPLIT(A1, " ")).
❓ Как скопировать таблицу из защищённого PDF?

Если PDF защищён паролем от редактирования, но не от чтения:

  1. Используйте Adobe Acrobat Pro для снятия защиты (Файл → Свойства → Безопасность → Удалить пароль).
  2. Или воспользуйтесь онлайн-сервисом iLovePDF Unlock PDF (бесплатно).

Если PDF защищён от копирования, сделайте скриншот таблицы и обработайте через OCR.

❓ Почему в экспортированной таблице пропали объединённые ячейки?

Большинство конвертеров не сохраняют объединения. Чтобы восстановить:

  1. В Excel выделите ячейки, которые должны быть объединены.
  2. Нажмите Объединить и поместить в центре на панели инструментов.
  3. Для массового объединения используйте макрос:
Sub MergeCells()

Dim rng As Range

For Each rng In Selection

If rng.Value = rng.Offset(0, 1).Value Then

Range(rng, rng.Offset(0, 1)).Merge

End If

Next rng

End Sub

❓ Как скопировать таблицу из PDF на телефоне?

На Android или iOS:

  1. Установите Adobe Scan или Microsoft Lens.
  2. Сфотографируйте таблицу из PDF (или сделайте скриншот).
  3. В приложении выберите опцию Экспортировать в Excel.
  4. Откройте файл в Excel Mobile или Google Sheets.

Для точности используйте OCR-приложения вроде Text Fairy (Android) или Scanner Pro (iOS).