Cómo extraer tablas de archivos PDF
Miscelánea / / November 29, 2021
El uso de archivos PDF es una forma fácil y segura de enviar y compartir documentos por correo. Cuando desee conservar el formato y los detalles de una tabla, es una buena idea convertir el documento en un archivo PDF. Sin embargo, extraer tablas de una es una gran tarea si recibe un archivo PDF.
Por supuesto, querrá ahorrar tiempo y no querrá crear una nueva tabla desde cero. Entonces, ¿cómo se extraen tablas de PDF sin depender de copiar y pegar? Estas son algunas de las formas en que puede lograrlo.
Usar convertidores en línea
La forma más rápida es utilizar los convertidores de archivos en línea para cambiar el archivo PDF a cualquier otro formato de documento que desee. Varias herramientas en línea gratuitas convierten PDF a Excel para extraer datos tabulares. Ejemplos populares son cometdocs y Smallpdf. Sin embargo, la mayoría de estas herramientas ofrecen solo capacidades de extracción básicas.
Descargo de responsabilidad: Le recomendamos encarecidamente que evite el uso de convertidores en línea al tratar con archivos PDF que contienen información confidencial y sensible.
A continuación, se explica cómo extraer tablas de archivos PDF con Smallpdf:
Paso 1: Visite el sitio web de Smallpdf.
Visite Smallpdf
Paso 2: Seleccione la conversión a realizar.
También en Guiding Tech
Paso 3: Arrastre el archivo PDF para convertirlo en el convertidor de PDF.
Paso 4: Una vez que haya terminado de cargar el archivo, haga clic en Convertir a Excel.
Paso 5: Haga clic en Descargar para guardar el archivo PDF en su dispositivo.
Paso 6: Inicie el Excel descargado para confirmar si su tabla se ha convertido con precisión.
Extraer tablas con Microsoft Power BI
Microsoft BI es otra herramienta útil para extraer datos de tablas de archivos PDF. En particular, la función Power Query en Power BI facilita a los usuarios importar archivos PDF y extraer los datos de la tabla dentro del documento.
Sin embargo, esto solo funciona para aquellos con suscripción a Office 365. Alternativamente, tendrá que comprar un paquete de Power BI por separado.
La función Power Query también está disponible en la versión de prueba gratuita de Power BI. A continuación, le indicamos cómo utilizarlo para extraer datos tabulares:
Paso 1: Descargue, instale y ejecute Microsoft Power BI.
Obtenga Microsoft Power BI
Paso 2: Seleccione Obtener datos en la sección Inicio del escritorio de la aplicación.
Paso 3: Haga clic en Archivo y luego seleccione PDF.
Paso 4: Haga clic en Conectar para buscar la ubicación del archivo PDF en su computadora.
Paso 5: Seleccione la ubicación del archivo PDF para importarlo a Power BI.
Paso 6: Una vez que el archivo se ha importado a Power BI, debería ver un navegador con números de tabla y números de página. Seleccione el Número de tabla que se cargará.
Paso 7: Seleccione Cargar para crear la tabla en Power BI.
Usando Microsoft Excel
Microsoft Excel como Power BI tiene la función Power Query que se puede usar para cargar archivos PDF y extraer datos tabulares. Sin embargo, esta función solo está disponible en Excel 2016 o versiones más recientes. Así es como funciona:
Paso 1: Inicie Microsoft Excel.
También en Guiding Tech
Paso 2: Seleccione Datos en la cinta.
Paso 3: Seleccione Obtener datos para iniciar el menú desplegable.
Paso 4: Seleccione Desde archivo y Desde PDF.
Paso 5: Seleccione la ubicación del archivo PDF para importarlo a Excel.
Paso 6: Una vez que el archivo se ha importado a Excel, debería ver un navegador con números de tabla, números de página o una vista previa de los datos dentro del PDF. Seleccione el Número de tabla que se cargará.
Paso 7: Seleccione Cargar para crear la tabla en Excel.
Si está utilizando Microsoft Office 2016 o un paquete más reciente y observa que su pestaña de datos no contiene la función Power Query. A continuación, le indicamos cómo instalarlo.
Paso 1: Visite el sitio web de Microsoft.
Descargar Power Query
Paso 2: Seleccione el idioma del complemento.
Paso 3: Seleccione Descargar.
Paso 4: Seleccione la versión del complemento que desea descargar.
Paso 5: Seleccione Siguiente para comenzar la descarga.
Paso 6: Una vez que se haya completado la descarga del archivo, ejecute el archivo para instalar el complemento.
Uso de Adobe Acrobat Pro DC
Adobe Acrobat Pro DC es otra herramienta que se puede utilizar para extraer datos tabulares de archivos PDF o convertir archivos PDF en otros tipos de archivos como Excel para el análisis de datos. La herramienta tiene una versión de prueba de 7 días y una versión profesional y se puede usar en línea o descargar a un dispositivo.
Versión web de Adobe Acrobat
A continuación, se explica cómo utilizar la versión web para extraer datos tabulares:
Paso 1: Visite el enlace web de Adobe Acrobat Pro DC.
Visite Adobe Acrobat Pro DC
Paso 2: En la parte superior de la página, seleccione el menú Convertir.
Paso 3: Desplácese hacia abajo en el sitio web y busque PDF a Excel.
También en Guiding Tech
Paso 4: En el nuevo menú emergente, arrastre y suelte el archivo PDF que desea convertir.
Paso 5: Una vez que haya terminado de cargar el archivo, seleccione Exportar a XLSX.
Paso 6: Seleccione el icono Descargar en la parte superior de la página para guardar el archivo convertido en su dispositivo.
Adobe Acrobat en PC
A continuación, se explica cómo utilizar la versión para PC para extraer datos tabulares:
Paso 1: Inicie la aplicación Adobe Acrobat Pro DC.
Paso 2: En la aplicación, seleccione Abrir un archivo.
Paso 3: Usando la biblioteca de archivos, seleccione el archivo PDF que se va a importar a la aplicación.
Paso 4: Una vez que se abre el archivo, use el cursor para resaltar los datos de la tabla.
Paso 5: Haga clic con el botón derecho en el área resaltada y seleccione Exportar selección como.
Paso 6: En la biblioteca de archivos, ingrese los detalles del nombre de archivo y seleccione el tipo de archivo.
Comparación de dos archivos PDF
Extraer tablas de archivos PDF no es una tarea imposible. Con Power Query en Excel y Power BI, puede importar otros tipos de archivos además de PDF. Por otro lado, con Adobe Acrobat Pro DC, puede comparar dos archivos PDF uno al lado del otro.