wisssbegierig
Goto Top

PDF auslesen und in Excel Tabelle schreiben

Ich möchte in folgendem PDF (hier Beispiel als Bilddatei) die orange umkreisten Felder auslesen und in Excel in je eine eigene Spalte automatisch eintragen lassen. Dabei müsste bei dem Feld "jährliche Erneuerungen" des PDFs das Jahr als Spaltenüberschrift und je nachdem ob unter dem Jahr eine Unterschrift ist oder ein Schrägstrich müsste in Excel in der jeweiligen Jahresspalte eine null oder eins eingetragen werden.
Vielleicht kann mir jemand weiterhelfen und zumindest beantworten, ob man das automatisieren könnte oder eher nicht.
Danke für die Hilfe!
3

Content-Key: 385812

Url: https://administrator.de/contentid/385812

Printed on: April 18, 2024 at 22:04 o'clock

Mitglied: 137084
137084 Sep 08, 2018 updated at 17:35:37 (UTC)
Goto Top
Mit entsprechend intelligenter Software ja, da es ja offensichtlich Handschriftliche Merkmale sind die ausgewertet werden müssen und da braucht es schon etwas mehr mit Imageprocessing:
https://sourceforge.net/projects/formscanner/
http://autodata.com/products/expert-scan/
https://www.abbyy.com/en-us/solutions/forms-processing/
https://www.scanstore.com/Scanning/Document_Imaging/Software/Form_&_ ...
Member: StefanKittel
StefanKittel Sep 08, 2018 at 17:56:23 (UTC)
Goto Top
Hallo,

nimm doch mal eine OCR-Software oder einen Kopierer der mit OCR scannen kann und scan mal 100 Dokumente ein.
Hier vergleiche mal das Original mit dem erkannten Texten.

So wie das hier aussieht gehe ich mal von einer Fehlerraten von mindestens 10% aus.
Der Aufwand das erkannte mit dem Original zu vergleichen ist sehr hoch.

Vermutlich ist es einfacher die Daten direkt digital zu erfassen.
Mit Tablets oder ähnlichen.
Oder sind es eh alte Zettel?

Stefan
Member: StefanKittel
StefanKittel Sep 08, 2018 at 18:15:53 (UTC)
Goto Top
Hallo,

ich habe Dein Bild mal durch meinen Mittelklasse-Dokumenten-Scanner geschickt.
Das Ergebnis ist ein PDF mit Text und Grafik. Ich habe es Dir eben per PN geschickt.

Du kannst den Text im PDF markieren, kopieren und in Word oder einem Editor einfügen.
Dann kannst Du sehen was er nicht erkennen konnte und was falsch.

Stefan