Преобразование таблиц из PDF в Excel — задача, с которой сталкиваются бухгалтеры, аналитики и студенты. В отличие от ручного переноса данных, онлайн-конвертеры экономят часы работы, но не все сервисы одинаково качественно справляются с форматами. Например, сканированные PDF (где текст — это картинка) требуют OCR-распознавания, а файлы с сложной вёрсткой могут "поехать" при конвертации.
В этой статье мы протестировали 7 бесплатных онлайн-сервисов, которые преобразуют PDF в .xlsx или .xls без установки программ. Вы узнаете, как избежать типичных ошибок (например, сбитых колонок или иероглифов вместо кириллицы), какие инструменты поддерживают пакетную обработку, а какие — распознавание отсканированных документов. Особое внимание уделим сохранению формул и форматирования, поскольку именно эти параметры чаще всего теряются при конвертации.
Почему PDF не всегда корректно конвертируется в Excel
Проблемы при преобразовании возникают из-за принципиальных различий между форматами:
- 📄 PDF — это "фотография" документа с фиксированным расположением элементов. Текст и таблицы в нём хранятся как графические примитивы, а не как редактируемые данные.
- 📊 Excel — динамическая таблица, где каждая ячейка имеет адрес (например,
A1) и может содержать формулы, форматы чисел или условное оформление.
Конвертеры пытаются "угадать", где в PDF начинается и заканчивается ячейка, но часто ошибаются. Например:
- 🔢 Слипшиеся колонки: если в PDF таблица без чётких границ, сервис может объединить соседние данные в одну ячейку Excel.
- 📉 Потеря формул: в PDF хранятся только результаты вычислений (например, число
100), но не сама формула (=СУММ(B2:B10)). - 🖼️ Сканированные PDF: требуют OCR (оптического распознавания символов), иначе на выходе получите пустой файл или растр.
Ещё одна ловушка — кодировка текста. Если PDF создан в старой версии Adobe Acrobat или экспортирован из 1С, кириллические символы могут превратиться в кракозябры. Решает проблему предварительная проверка кодировки (например, в Notepad++) или использование сервисов с поддержкой UTF-8.
Топ-7 бесплатных онлайн-конвертеров PDF в Excel
Мы отобрали сервисы по критериям:
- ✅ Бесплатность (без скрытых платежей за скачивание результата).
- ✅ Поддержка русского языка в интерфейсе или инструкциях.
- ✅ Возможность конвертации файлов объёмом до 50 МБ (стандарт для большинства таблиц).
- ✅ Сохранение структуры таблиц (не менее 80% точности для тестовых файлов).
В таблице ниже — сравнение ключевых параметров. Обратите внимание на столбец "OCR" — он важен, если вы работаете со сканами или фотографиями документов.
| Сервис | Макс. размер файла | OCR | Пакетная обработка | Сохраняет формулы | Экспорт в облако |
|---|---|---|---|---|---|
| Smallpdf | 50 МБ | ❌ Нет | ❌ Нет | ❌ Нет | ✅ Google Drive, Dropbox |
| iLovePDF | 100 МБ | ✅ Да (платно) | ✅ До 20 файлов | ❌ Нет | ✅ Google Drive |
| PDF2Go | 50 МБ | ✅ Да (бесплатно) | ❌ Нет | ❌ Нет | ✅ Облако сервиса |
| Adobe Acrobat Online | 100 МБ | ✅ Да | ❌ Нет | ✅ Частично | ✅ Adobe Cloud |
| Zamzar | 50 МБ | ❌ Нет | ✅ До 10 файлов | ❌ Нет |
Для тестирования мы использовали 3 типа файлов:
- PDF с таблицей из 50 строк и 10 колонок (чёткие границы ячеек).
- Сканированный PDF (фото таблицы с разрешением 300 dpi).
- PDF с формулами и условным форматированием (экспортированный из Excel).
Пошаговая инструкция: как конвертировать PDF в Excel на примере Smallpdf
Рассмотрим процесс на примере Smallpdf — одного из самых популярных сервисов с интуитивным интерфейсом. Инструкция подойдёт и для других инструментов (iLovePDF, PDF2Go), поскольку их алгоритмы схожи.
☑️ Подготовка файла перед конвертацией
- Загрузка файла
Перейдите на страницу конвертера и перетащите PDF в обозначенную зону или нажмите "
Выбрать файл". Сервис поддерживает загрузку с Google Drive и Dropbox. - Настройка параметров
В большинстве сервисов этот шаг пропускается, но в Adobe Acrobat Online можно выбрать:
-
Сохранить макет таблицы(рекомендуется для сложных документов).-
Распознать текст (OCR)— для сканированных файлов. - Преобразование
Нажмите "
Конвертировать в Excel" и дождитесь обработки. Время зависит от размера файла: документ на 10 МБ конвертируется ~30 секунд. - Скачивание результата
После завершения нажмите "
Скачать файл". Smallpdf предлагает также сохранить результат в облако или отправить на email.
Если на выходе вы получили файл с иероглифами вместо кириллицы, попробуйте:
- 🔄 Повторить конвертацию в другом сервисе (например, PDF2Go).
- 📋 Открыть полученный
.xlsxв LibreOffice Calc — он лучше справляется с кодировками. - 🛠️ Использовать
Notepad++для замены кодировки сWindows-1251наUTF-8.
Как конвертировать сканированный PDF в Excel (с OCR)
Сканированные документы, фотографии таблиц или PDF, созданные из изображений, требуют оптического распознавания символов (OCR). Бесплатно эту функцию предлагают только Adobe Acrobat Online и PDF2Go. Рассмотрим процесс на примере PDF2Go:
- Загрузка файла
Перейдите на pdf2go.com и выберите "
Выбрать файл". Сервис поддерживает форматы.pdf,.jpg,.png. - Включение OCR
После загрузки отметьте галочку "
Распознать текст (OCR)" и выберите язык документа (например, "Русский"). Это критично для корректного распознавания кириллицы. - Настройка области распознавания
PDF2Go позволяет вручную обвести область таблицы на изображении. Это повышает точность, если на скане есть лишние элементы (печати, подписи). - Экспорт результата
После обработки скачайте файл в формате
.xlsx. Проверьте результат: OCR может ошибаться с цифрой "0" (распознавать как букву "О") или с символами "1" и "л".
Точность OCR зависит от качества исходного скана:
- 📸 300 dpi и выше: ошибки в 1–2 символа на страницу.
- 📸 150–200 dpi: до 10% ошибок (требуется ручная правка).
- 📸 Ниже 150 dpi: OCR бесполезен — символы сливаются.
Что делать, если OCR распознаёт цифры как буквы?
Используйте функцию "НАЙТИ и ЗАМЕНИТЬ" в Excel (Ctrl+H), чтобы заменить:
- "О" на "0"
- "л" на "1"
- "В" на "6"
Для пакетной замены запишите макрос или используйте Power Query (вкладка "Данные → Из таблицы/диапазона").
Частые ошибки и как их исправить
Даже лучшие конвертеры дают сбои. Мы собрали типичные проблемы и способы их решения:
⚠️ Внимание: Если PDF защищён паролем, majority онлайн-сервисов не смогут его конвертировать. Используйте Adobe Acrobat Pro (платный) или инструмент LostMyPass для снятия защиты.
| Проблема | Причина | Решение |
|---|---|---|
| Слипшиеся ячейки | В PDF нет чётких границ таблицы | Используйте Текст по столбцам в Excel (Данные → Текст по столбцам) |
| Иероглифы вместо текста | Неверная кодировка | Откройте файл в LibreOffice Calc или конвертируйте в UTF-8 через Notepad++ |
| Потеряны формулы | PDF хранит только результаты вычислений | Восстановите формулы вручную или используйте Adobe Acrobat Pro (сохраняет часть формул) |
| Пустой файл на выходе | PDF создан как изображение (без текстового слоя) | Используйте сервис с OCR (например, PDF2Go) |
Если после конвертации в Excel отображаются даты в формате текст (например, "31.12.2023" как строка), исправьте это:
- Выделите столбец с датами.
- Перейдите на вкладку "
Главная→Формат→Форматировать ячейки". - Выберите категорию "
Дата" и нужный формат (например, "14.03.2012").
Для автоматической правки больших таблиц используйте Power Query:
= Table.TransformColumns(#"Предыдущий шаг", {{"Столбец1", each Date.From(_), type date}})
Альтернативные способы: без онлайн-сервисов
Если вам важна конфиденциальность (например, в PDF содержатся персональные данные), избегайте загрузки файлов на сторонние сервисы. Вот 3 офлайн-метода:
- 🖥️ Excel + Power Query:
Откройте Excel, перейдите на вкладку "
Данные→Получить данные→Из файла→Из PDF". Инструмент Power Query импортирует таблицы с сохранением структуры (но не формул). - 📂 LibreOffice Calc:
Бесплатный аналог Excel поддерживает прямой импорт PDF. Откройте файл через "
Файл → Открыть" и выберите.pdf. Точность ниже, чем у онлайн-сервисов, но нет рисков утечки данных. - 🤖 Python + библиотека tabula-py:
Для программистов: установите библиотеку через
pip install tabula-pyи выполните команду:tabula.read_pdf("file.pdf", pages="all", multiple_tables=True)Результат экспортируется в
DataFrame, который затем сохраняется в Excel.
Для пакетной обработки (например, 100 PDF-файлов) подойдёт скрипт на Python:
import tabula
import os
folder = "path_to_pdf_folder"
for file in os.listdir(folder):
if file.endswith(".pdf"):
df = tabula.read_pdf(os.path.join(folder, file), pages="all")
df.to_excel(f"{file.replace('.pdf', '.xlsx')}", index=False)
Сравнение онлайн- и офлайн-методов: что выбрать
Выбор способа конвертации зависит от целей, объёма данных и требований к безопасности. Ниже — сравнительная таблица:
| Критерий | Онлайн-сервисы | Офлайн-методы |
|---|---|---|
| Скорость | ⚡ Быстро (1–2 минуты) | 🐢 Медленнее (настройка Power Query/Python) |
| Безопасность | ❌ Риск утечки данных | ✅ Полный контроль над файлами |
| OCR (сканы) | ✅ Да (в некоторых сервисах) | ❌ Нет (требуется отдельное ПО) |
| Пакетная обработка | ✅ Да (до 20 файлов) | ✅ Да (через скрипты) |
| Стоимость | ✅ Бесплатно (с лимитами) | ✅ Бесплатно (LibreOffice, Python) |
Для разовых задач (например, конвертация 1–2 файлов) подойдут онлайн-сервисы. Если вы работаете с конфиденциальными данными (бухгалтерские отчёты, медицинские карты), используйте офлайн-инструменты. Для автоматизации (ежедневная обработка десятков PDF) наилучший вариант — скрипты на Python или Power Query.
FAQ: ответы на частые вопросы
Можно ли конвертировать PDF в Excel с формулами?
Нет, majority онлайн-сервисов сохраняют только результаты вычислений, но не сами формулы. Исключение — Adobe Acrobat Pro (платная версия), который частично восстанавливает простые формулы типа =СУММ(). Для сложных вычислений придётся пересоздавать формулы вручную.
Почему после конвертации в Excel вместо чисел отображаются знаки "#"?
Это происходит из-за:
- Несоответствия форматов: ячейка в Excel имеет формат "Текст", а данные — числа. Решение: выделите столбец → "
Формат ячеек" → выберите "Числовой". - Слишком длинных чисел: Excel не поддерживает числа длиннее 15 знаков. Решение: разбейте число на части или используйте формат "Текст".
Как конвертировать PDF в Excel на телефоне (Android/iOS)?summary>
Для мобильных устройств подойдут:
- 📱 Adobe Scan (Android/iOS): фотографирует таблицу, распознаёт текст и экспортирует в Excel.
- 📱 Microsoft Lens: сканирует документы и сохраняет в
.xlsx через OneDrive.
- 📱 CamScanner: плагин для конвертации PDF в Excel (требует подписку).
Точность на телефоне ниже, чем на ПК, из-за ограничений OCR на мобильных устройствах.
.xlsx через OneDrive.Можно ли конвертировать защищённый паролем PDF в Excel?
Да, но сначала нужно снять защиту. Способы:
- 🔓 Используйте LostMyPass (онлайн).
- 🔓 В Adobe Acrobat Pro: "
Файл → Свойства → Безопасность" → снимите ограничения. - 🔓 Через Python (библиотека PyPDF2):
from PyPDF2 import PdfFileReader, PdfFileWriterpdf = PdfFileReader("protected.pdf")
if pdf.isEncrypted:
pdf.decrypt("password") # замените на ваш пароль
writer = PdfFileWriter()
for page in pdf.pages:
writer.addPage(page)
with open("unlocked.pdf", "wb") as f:
writer.write(f)
⚠️ Внимание: Снятие защиты с чужих документов может нарушать закон об авторском праве. Убедитесь, что у вас есть права на редактирование файла.
Как сохранить форматирование (цвета, шрифты) при конвертации?
Majority сервисов сохраняют только базовое форматирование (жирный текст, выравнивание). Для сложного оформления (условное форматирование, стили ячеек):
- Используйте Adobe Acrobat Pro — он лучше других передаёт стили.
- После конвертации примените в Excel "
Условное форматирование" (Главная → Условное форматирование → Управление правилами). - Для цветов ячеек используйте функцию "
НАЙТИ и ВЫДЕЛИТЬ" (Ctrl+F → "Формат").