Kako ekstrahirati tabele iz datotek PDF
Miscellanea / / November 29, 2021
Uporaba datotek PDF je preprost in varen način za pošiljanje in skupno rabo dokumentov. Če želite ohraniti obliko in podrobnosti tabele, je dobro, da dokument pretvorite v datoteko PDF. Vendar pa je ekstrahiranje tabel iz ene kar precejšnja naloga, če prejemate datoteko PDF.
Seveda bi želeli prihraniti čas in ne bi želeli ustvariti nove tabele iz nič. Kako torej ekstrahirate tabele iz PDF-ja, ne da bi se zanašali na kopiranje in lepljenje? Tukaj je nekaj načinov, kako lahko to dosežete.
Uporaba spletnih pretvornikov
Najhitrejši način je, da s spletnimi pretvorniki datotek spremenite datoteko PDF v katero koli drugo obliko dokumenta, ki jo želite. Več brezplačnih spletnih orodij pretvori PDF v Excel za ekstrakcijo tabelarnih podatkov. Priljubljeni primeri so kometdocs in Majhen pdf. Vendar večina teh orodij ponuja le osnovne zmogljivosti ekstrakcije.
Izjava o omejitvi odgovornosti: Močno vam svetujemo, da se izogibate uporabi spletnih pretvornikov pri delu z datotekami PDF, ki vsebujejo zaupne in občutljive informacije.
Tukaj je, kako ekstrahirati tabele iz datotek PDF z uporabo Smallpdf:
Korak 1: Obiščite spletno mesto Smallpdf.
Obiščite Smallpdf
2. korak: Izberite pretvorbo, ki jo želite izvesti.
Tudi na Guiding Tech
3. korak: Povlecite datoteko PDF, ki jo želite pretvoriti v pretvornik PDF.
4. korak: Ko je datoteka končana, kliknite Pretvori v Excel.
5. korak: Kliknite Prenesi, da shranite datoteko PDF v svojo napravo.
6. korak: Zaženite preneseni Excel, da preverite, ali je bila vaša tabela natančno pretvorjena.
Ekstrahirajte tabele z uporabo Microsoft Power BI
Microsoft BI je še eno uporabno orodje za ekstrakcijo podatkov tabele iz datotek PDF. Zlasti funkcija Power Query v Power BI uporabnikom olajša uvoz datotek PDF in ekstrahiranje podatkov tabele v dokumentu.
Vendar to deluje samo za tiste z naročnino na Office 365. Druga možnost je, da boste morali posebej kupiti paket Power BI.
Funkcija Power Query je na voljo tudi v okviru brezplačne preskusne različice Power BI. Tukaj je, kako ga uporabite za ekstrakcijo tabelarnih podatkov:
Korak 1: Prenesite, namestite in zaženite Microsoft Power BI.
Pridobite Microsoft Power BI
2. korak: Izberite Pridobi podatke v razdelku Domov na namizju aplikacije.
3. korak: Kliknite Datoteka in nato izberite PDF.
4. korak: Kliknite Poveži za brskanje po lokaciji datoteke PDF v računalniku.
5. korak: Izberite lokacijo datoteke PDF, da jo uvozite v Power BI.
6. korak: Ko je datoteka uvožena v Power BI, bi morali videti Navigator s številkami tabel in številkami strani. Izberite številko tabele, ki jo želite naložiti.
7. korak: Izberite Naloži, da ustvarite tabelo v Power BI.
Uporaba programa Microsoft Excel
Microsoft Excel, kot je Power BI, ima funkcijo Power Query, ki jo lahko uporabite za nalaganje datotek PDF in ekstrahiranje tabeličnih podatkov. Vendar je ta funkcija na voljo samo v Excelu 2016 ali novejših različicah. Takole deluje:
Korak 1: Zaženite Microsoft Excel.
Tudi na Guiding Tech
2. korak: Izberite Podatki na traku.
3. korak: Izberite Pridobi podatke, da zaženete spustni meni.
4. korak: Izberite Iz datoteke in Iz PDF-ja.
5. korak: Izberite lokacijo datoteke PDF, da jo uvozite v Excel.
6. korak: Ko je datoteka uvožena v Excel, bi morali videti Navigator s številkami tabel, številkami strani ali predogledom podatkov v PDF-ju. Izberite številko tabele, ki jo želite naložiti.
7. korak: Izberite Naloži, da ustvarite tabelo v Excelu.
Če uporabljate Microsoft Office 2016 ali novejši paket in opazite, da vaš zavihek s podatki ne vsebuje funkcije Power Query. Tukaj je opisano, kako ga namestiti.
Korak 1: Obiščite Microsoftovo spletno mesto.
Prenesite Power Query
2. korak: Izberite jezik dodatka.
3. korak: Izberite Prenesi.
4. korak: Izberite različico dodatka, ki ga želite prenesti.
5. korak: Izberite Naprej, da začnete s prenosom.
6. korak: Ko je prenos datoteke končan, zaženite datoteko, da namestite dodatek.
Uporaba Adobe Acrobat Pro DC
Adobe Acrobat Pro DC je še eno orodje, ki ga lahko uporabite za ekstrakcijo tabeličnih podatkov iz datotek PDF ali pretvorbo datotek PDF v druge vrste datotek, kot je excel za analizo podatkov. Orodje ima 7-dnevno preizkusno različico in profesionalno različico ter se lahko uporablja na spletu ali prenese na napravo.
Spletna različica Adobe Acrobat
Tukaj je opisano, kako uporabiti spletno različico za ekstrakcijo tabelarnih podatkov:
Korak 1: Obiščite spletno povezavo Adobe Acrobat Pro DC.
Obiščite Adobe Acrobat Pro DC
2. korak: Na vrhu strani izberite meni Pretvori.
3. korak: Pomaknite se navzdol po spletnem mestu in poiščite PDF v Excelu.
Tudi na Guiding Tech
4. korak: V novem pojavnem meniju povlecite in spustite datoteko PDF, ki jo želite pretvoriti.
5. korak: Ko je datoteka končana, izberite Izvozi v XLSX.
6. korak: Izberite ikono Prenos na vrhu strani, da shranite pretvorjeno datoteko v svojo napravo.
Adobe Acrobat na osebnem računalniku
Takole uporabite različico za računalnik za ekstrakcijo tabelarnih podatkov:
Korak 1: Zaženite aplikacijo Adobe Acrobat Pro DC.
2. korak: V aplikaciji izberite Odpri datoteko.
3. korak: Z uporabo knjižnice datotek izberite datoteko PDF, ki jo želite uvoziti v aplikacijo.
4. korak: Ko se datoteka odpre, s kazalcem označite podatke tabele.
5. korak: Z desno tipko miške kliknite označeno območje in izberite Izvozi izbor kot.
6. korak: V knjižnico datotek vnesite podrobnosti imena datoteke in izberite vrsto datoteke.
Primerjava dveh datotek PDF
Ekstrahiranje tabel iz datotek PDF ni nemogoča naloga. Z uporabo Power Query v Excelu in Power BI lahko poleg PDF-ja uvozite druge vrste datotek. Po drugi strani pa lahko z uporabo Adobe Acrobat Pro DC primerjaj dve datoteki PDF drug ob drugem.