excelvba-interessent
Goto Top

Welche Kenntnisse erforderlich für PDF auslesen mit VBA?

Hallo Freunde,

ich bin durch meine Google-Suche auf diesen Forum gestoßen.

Ich würde gerne PDF-Datei mit einer VBA-Programmierung auslesen können und dann die Informaionen auch in eine Excel Tabelle einspeisen.

Ich hab dazu auch einen Beitrag gefunden.

PDF auslesen und per VBA in Excel schreiben

Aber ich würde gerne in der Lage sein dieses bereits geschriebene VBA-Programm zu verstehen und wenn nicht sogar auch
ganz nach meinen Bedürfnissen irgendwann auch zu erweitern und zu verändern.

Deshalb wollte ich euch bitten mir vielleicht einen Tipp zu geben, mit welchen Funktionen bzw. Befehlen ich mich genauer auseinander setzen sollte?


Ich danke euch vielmals im voraus.

Schöne Grüße

Content-Key: 383016

Url: https://administrator.de/contentid/383016

Printed on: April 19, 2024 at 04:04 o'clock

Member: SeaStorm
SeaStorm Aug 10, 2018 updated at 20:23:42 (UTC)
Goto Top
Hi

das dort verlinkte Skript macht nicht wirklich was mit dem PDF. Es wird lediglich ein Tool verwendet, das den ganzen Text aus einer PDF extrahiert.
Und dann geht das Script per Regex hin und zieht sich die Informationen, die es braucht.

Regex ist in diesem Fall also die Technik, mit der du dich auseinandersetzen solltest.
Member: colinardo
colinardo Aug 11, 2018 updated at 08:22:14 (UTC)
Goto Top
Sie ist es. Ein essentielles Verständnis von Regulären Ausdrücken ist hier unverzichtbar wenn das ganze effizient ablaufen soll.
Der Rest ist reines Basiswissen von VBA.

Und auch mit Powershell das ganze dann noch ohne pdf2text problemlos nutzbar, aber auch hier sollte Regex zur Wissensbasis gehören:
Skript zum Auslesen und Automatischen Versenden von E-Mails

Grüße Uwe
Member: StefanKittel
StefanKittel Aug 11, 2018 at 09:33:59 (UTC)
Goto Top
Hallo,

bedenke auch, dass PDF nicht gleich PDF ist.
Wenn ein PDF eingescannt wurde, kann es durchaus nur eine große Grafik enthalten.
Dafür braucht man dann auch noch OCR. Und bei OCR ändert sich häufig die Reihenfolge der Blöcke auf der Seite.

Stefan