Как извлечь таблицы из файлов PDF
Разное / / November 29, 2021
Использование файлов PDF - это простой и безопасный способ рассылки документов и обмена ими. Если вы хотите сохранить формат и детали таблицы, рекомендуется преобразовать документ в файл PDF. Однако извлечение таблиц из одной из них - довольно сложная задача, если вы получаете файл PDF.
Конечно, вы захотите сэкономить время и не захотите создавать новую таблицу с нуля. Итак, как извлечь таблицы из PDF, не полагаясь на копирование и вставку? Вот несколько способов добиться этого.
Использование онлайн-конвертеров
Самый быстрый способ - использовать онлайн-конвертеры файлов, чтобы преобразовать файл PDF в любой другой формат документа, который вы хотите. Несколько бесплатных онлайн-инструментов конвертируют PDF в Excel для извлечения табличных данных. Популярные примеры: Cometdocs а также Smallpdf. Однако большинство этих инструментов предлагают только базовые возможности извлечения.
Заявление об ограничении ответственности: Мы настоятельно рекомендуем вам избегать использования онлайн-конвертеров при работе с файлами PDF, которые содержат конфиденциальную и конфиденциальную информацию.
Вот как извлечь таблицы из файлов PDF с помощью Smallpdf:
Шаг 1: Посетите веб-сайт Smallpdf.
Посетить Smallpdf
Шаг 2: Выберите преобразование, которое нужно выполнить.
Также на Guiding Tech
Шаг 3: Перетащите PDF-файл, который нужно преобразовать в PDF-конвертер.
Шаг 4: Когда файл будет загружен, нажмите «Преобразовать в Excel».
Шаг 5: Нажмите «Загрузить», чтобы сохранить PDF-файл на свое устройство.
Шаг 6: Запустите загруженный Excel, чтобы убедиться, что ваша таблица была точно преобразована.
Извлечение таблиц с помощью Microsoft Power BI
Microsoft BI - еще один полезный инструмент для извлечения табличных данных из файлов PDF. В частности, функция Power Query в Power BI позволяет пользователям легко импортировать файлы PDF и извлекать данные таблицы внутри документа.
Однако это работает только для тех, у кого есть подписка на Office 365. В качестве альтернативы вам придется приобрести пакет Power BI отдельно.
Функция Power Query также доступна в рамках бесплатной пробной версии Power BI. Вот как его использовать для извлечения табличных данных:
Шаг 1: Загрузите, установите и запустите Microsoft Power BI.
Получите Microsoft Power BI
Шаг 2: Выберите Получить данные в главном разделе рабочего стола приложения.
Шаг 3: Щелкните Файл, затем выберите PDF.
Шаг 4: Нажмите «Подключиться», чтобы просмотреть расположение файла PDF на вашем компьютере.
Шаг 5: Выберите расположение файла PDF, чтобы импортировать его в Power BI.
Шаг 6: После импорта файла в Power BI вы должны увидеть навигатор с номерами таблиц и номерами страниц. Выберите номер таблицы для загрузки.
Шаг 7: Выберите Загрузить, чтобы создать таблицу в Power BI.
Использование Microsoft Excel
Microsoft Excel, как и Power BI, имеет функцию Power Query, которую можно использовать для загрузки файлов PDF и извлечения табличных данных. Однако эта функция доступна только в Excel 2016 или более новых версиях. Вот как это работает:
Шаг 1: Запустите Microsoft Excel.
Также на Guiding Tech
Шаг 2: Выберите данные на ленте.
Шаг 3: Выберите Получить данные, чтобы открыть раскрывающийся список.
Шаг 4: Выберите «Из файла» и «Из PDF».
Шаг 5: Выберите расположение файла PDF, чтобы импортировать его в Excel.
Шаг 6: После того, как файл был импортирован в Excel, вы должны увидеть навигатор с номерами таблиц, номерами страниц или предварительный просмотр данных в PDF. Выберите номер таблицы для загрузки.
Шаг 7: Выберите Загрузить, чтобы создать таблицу в Excel.
Если вы используете Microsoft Office 2016 или более новый пакет и заметили, что на вкладке данных нет функции Power Query. Вот как это установить.
Шаг 1: Посетите веб-сайт Microsoft.
Скачать Power Query
Шаг 2: Выберите язык надстройки.
Шаг 3: Выберите Загрузить.
Шаг 4: Выберите версию надстройки, которую хотите загрузить.
Шаг 5: Выберите «Далее», чтобы начать загрузку.
Шаг 6: После завершения загрузки файла запустите файл, чтобы установить надстройку.
Использование Adobe Acrobat Pro DC
Adobe Acrobat Pro DC - еще один инструмент, который можно использовать для извлечения табличных данных из файлов PDF или преобразования файлов PDF в файлы других типов, такие как Excel для анализа данных. У инструмента есть 7-дневная пробная и профессиональная версии, которые можно использовать онлайн или загрузить на устройство.
Веб-версия Adobe Acrobat
Вот как использовать веб-версию для извлечения табличных данных:
Шаг 1: Посетите веб-ссылку Adobe Acrobat Pro DC.
Посетите Adobe Acrobat Pro DC
Шаг 2: Вверху страницы выберите меню «Преобразовать».
Шаг 3: Прокрутите сайт вниз и найдите PDF в Excel.
Также на Guiding Tech
Шаг 4: В новом всплывающем меню перетащите PDF-файл, который хотите преобразовать.
Шаг 5: После завершения загрузки файла выберите Экспорт в XLSX.
Шаг 6: Щелкните значок «Загрузить» вверху страницы, чтобы сохранить преобразованный файл на свое устройство.
Adobe Acrobat на ПК
Вот как использовать версию для ПК для извлечения табличных данных:
Шаг 1: Запустите приложение Adobe Acrobat Pro DC.
Шаг 2: В приложении выберите Открыть файл.
Шаг 3: Используя файловую библиотеку, выберите PDF-файл для импорта в приложение.
Шаг 4: Когда файл откроется, используйте курсор, чтобы выделить данные таблицы.
Шаг 5: Щелкните правой кнопкой мыши выделенную область и выберите «Экспортировать выделенный фрагмент как».
Шаг 6: В библиотеке файлов введите сведения об имени файла и выберите тип файла.
Сравнение двух файлов PDF
Извлечение таблиц из файлов PDF не является невыполнимой задачей. Используя Power Query в Excel и Power BI, вы можете импортировать файлы других типов, кроме PDF. С другой стороны, используя Adobe Acrobat Pro DC, вы можете сравнить два PDF-файла рядом.