Jak wyodrębnić tabele z plików PDF
Różne / / November 29, 2021
Korzystanie z plików PDF to łatwy i bezpieczny sposób wysyłania i udostępniania dokumentów. Jeśli chcesz zachować format i szczegóły tabeli, dobrym pomysłem jest przekonwertowanie dokumentu na plik PDF. Jednak wyodrębnienie tabel z jednej jest sporym zadaniem, jeśli otrzymujesz plik PDF.
Oczywiście chciałbyś zaoszczędzić czas i nie chciałbyś tworzyć nowej tabeli od zera. Jak więc wyodrębnić tabele z pliku PDF bez polegania na kopiowaniu i wklejaniu? Oto kilka sposobów, w jakie możesz to osiągnąć.
Korzystanie z konwerterów online
Najszybszym sposobem jest użycie konwerterów plików online do zmiany pliku PDF na dowolny inny format dokumentu. Kilka darmowych narzędzi online umożliwia konwersję PDF do Excela aby wyodrębnić dane tabelaryczne. Popularne przykłady to kometdocs oraz Małypdf. Jednak większość z tych narzędzi oferuje tylko podstawowe możliwości ekstrakcji.
Zastrzeżenie: Zdecydowanie radzimy unikać korzystania z konwerterów online w przypadku plików PDF zawierających poufne i wrażliwe informacje.
Oto jak wyodrębnić tabele z plików PDF za pomocą Smallpdf:
Krok 1: Odwiedź witrynę Smallpdf.
Odwiedź Smallpdf
Krok 2: Wybierz konwersję do wykonania.
Również na Guiding Tech
Krok 3: Przeciągnij plik PDF, który chcesz przekonwertować na konwerter PDF.
Krok 4: Po zakończeniu przesyłania pliku kliknij Konwertuj do programu Excel.
Krok 5: Kliknij Pobierz, aby zapisać plik PDF na swoim urządzeniu.
Krok 6: Uruchom pobrany program Excel, aby sprawdzić, czy Twoja tabela została dokładnie przekonwertowana.
Wyodrębnij tabele za pomocą Microsoft Power BI
Microsoft BI to kolejne przydatne narzędzie do wyodrębniania danych tabel z plików PDF. W szczególności funkcja Power Query w usłudze Power BI ułatwia użytkownikom importowanie plików PDF i wyodrębnianie danych z tabeli w dokumencie.
Działa to jednak tylko dla osób z subskrypcją Office 365. Alternatywnie będziesz musiał osobno kupić pakiet Power BI.
Funkcja Power Query jest również dostępna w ramach bezpłatnej wersji próbnej usługi Power BI. Oto jak go użyć do wyodrębnienia danych tabelarycznych:
Krok 1: Pobierz, zainstaluj i uruchom Microsoft Power BI.
Uzyskaj Microsoft Power BI
Krok 2: Wybierz Pobierz dane w sekcji Strona główna pulpitu aplikacji.
Krok 3: Kliknij Plik, a następnie wybierz PDF.
Krok 4: Kliknij Połącz, aby przeglądać lokalizację pliku PDF na komputerze.
Krok 5: Wybierz lokalizację pliku PDF, aby zaimportować go do usługi Power BI.
Krok 6: Po zaimportowaniu pliku do usługi Power BI powinien pojawić się Nawigator z numerami tabel i numerami stron. Wybierz numer tabeli do załadowania.
Krok 7: Wybierz opcję Załaduj, aby utworzyć tabelę w usłudze Power BI.
Korzystanie z programu Microsoft Excel
Microsoft Excel, taki jak Power BI, ma funkcję Power Query, której można używać do ładowania plików PDF i wyodrębniania danych tabelarycznych. Jednak ta funkcja jest dostępna tylko w programie Excel 2016 lub nowszych wersjach. Oto jak to działa:
Krok 1: Uruchom Microsoft Excel.
Również na Guiding Tech
Krok 2: Wybierz dane na wstążce.
Krok 3: Wybierz Pobierz dane, aby uruchomić menu rozwijane.
Krok 4: Wybierz opcję Z pliku i Z pliku PDF.
Krok 5: Wybierz lokalizację pliku PDF, aby zaimportować go do programu Excel.
Krok 6: Po zaimportowaniu pliku do programu Excel powinien pojawić się Nawigator z numerami tabel, numerami stron lub podglądem danych w pliku PDF. Wybierz numer tabeli do załadowania.
Krok 7: Wybierz opcję Załaduj, aby utworzyć tabelę w programie Excel.
Jeśli korzystasz z pakietu Microsoft Office 2016 lub nowszego pakietu i zauważysz, że karta danych nie zawiera funkcji Power Query. Oto jak go zainstalować.
Krok 1: Odwiedź witrynę firmy Microsoft.
Pobierz Power Query
Krok 2: Wybierz język dodatku.
Krok 3: Wybierz Pobierz.
Krok 4: Wybierz wersję dodatku, który chcesz pobrać.
Krok 5: Wybierz Dalej, aby rozpocząć pobieranie.
Krok 6: Po zakończeniu pobierania pliku uruchom plik, aby zainstalować dodatek.
Korzystanie z Adobe Acrobat Pro DC
Adobe Acrobat Pro DC to kolejne narzędzie, którego można użyć do wyodrębniania danych tabelarycznych z plików PDF lub konwertowania plików PDF na inne typy plików, takie jak Excel do analizy danych. Narzędzie ma 7-dniową wersję próbną oraz wersję profesjonalną i może być używane online lub pobierane na urządzenie.
Wersja internetowa programu Adobe Acrobat
Oto jak używać wersji internetowej do wyodrębniania danych tabelarycznych:
Krok 1: Odwiedź łącze internetowe Adobe Acrobat Pro DC.
Odwiedź Adobe Acrobat Pro DC
Krok 2: U góry strony wybierz menu Konwertuj.
Krok 3: Przewiń stronę i znajdź PDF do Excela.
Również na Guiding Tech
Krok 4: W nowym menu podręcznym przeciągnij i upuść plik PDF, który chcesz przekonwertować.
Krok 5: Po zakończeniu przesyłania pliku wybierz opcję Eksportuj do XLSX.
Krok 6: Wybierz ikonę Pobierz u góry strony, aby zapisać przekonwertowany plik na urządzeniu.
Adobe Acrobat na PC
Oto jak używać wersji na PC do wyodrębniania danych tabelarycznych:
Krok 1: Uruchom aplikację Adobe Acrobat Pro DC.
Krok 2: W aplikacji wybierz Otwórz plik.
Krok 3: Korzystając z biblioteki plików, wybierz plik PDF, który chcesz zaimportować do aplikacji.
Krok 4: Po otwarciu pliku użyj kursora, aby podświetlić dane tabeli.
Krok 5: Kliknij prawym przyciskiem myszy podświetlony obszar i wybierz opcję Eksportuj wybór jako.
Krok 6: W Bibliotece plików wprowadź szczegóły nazwy pliku i wybierz typ pliku.
Porównanie dwóch plików PDF
Wyodrębnianie tabel z plików PDF nie jest zadaniem niemożliwym. Korzystając z dodatku Power Query w programach Excel i Power BI, możesz importować inne typy plików oprócz PDF. Z drugiej strony, używając Adobe Acrobat Pro DC, możesz porównaj dwa pliki PDF obok siebie.