visucius
Goto Top

Ios-App, Scan, pdf, ocr, fortl. auto-Name

Hallo in die Runde,

hatte meinen letzten Beitrag gelöscht, weil sich die Problematik eigentlich auf recht überschaubare Funktionalität runterdampfte. Nachdem ich jetzt aber etliche Apps installierte, probierte und nicht das passende fand, ruf ich hier nochmal um Hilfe:

Gesucht:
  • Beleg/Qittung/Rechnung in IOS scannen
  • OCR Deutsch/Englisch
  • Speichern (Jahr/Monat_fortlaufende Zählung)
  • Einfacher Export zu oneDrive/Sharepoint


Problem:
  • Die fortlaufende Zählung im Dateinamen

Die Apps lassen automatisch nur Datum und Uhrzeit zu, der Rest muss manuell gemacht werden.

Die Idee war eigentlich, dass der Beleg fotografiert wird - die fortlaufende Nummer auf dem Original vermerkt und dann gleich unter dem Monat "geleitzt" wird. Der Scan kommt dann extern zur Buchung. Anhand des Monats und der Nummer lassen sie sich dem Original recht schnell zuordnen.

Kennt jemand ne App, die sowas beherrscht?!

Mal so ne richtige Freitags-Frage face-wink

Euch ein schönes, sonniges und erholsames WE.

Content-Key: 3555690032

Url: https://administrator.de/contentid/3555690032

Printed on: April 27, 2024 at 06:04 o'clock

Member: transocean
Solution transocean Aug 05, 2022 at 18:31:41 (UTC)
Goto Top
Moin,

in der App Scanner Pro gibt es die Möglichkeit, Arbeitsabläufe zu definieren. Darunter gab es meiner Erinnerung nach auch einen Punkt "Umbenennen". Ich weiß allerdings im Moment nicht, ob sich das auch auf den Dateinamen bezog.

Gruß

Uwe
Member: Crusher79
Crusher79 Aug 06, 2022 at 09:44:57 (UTC)
Goto Top
Hallo,

iOS leider kein Plan. Ich gehe mal davon aus: PDF/ Bild liegt unter Windows.

Eine Möglichkeit bei PDF wäre OCR zu machen: Tesseract ist kostenlos und multilinugal. Im nächsten Step mit pdftotext extrahieren.

Je nach Layout stehen die Nummern und Datum neben oder untereinander. Kommt dabei auch auf die Dokumente an.

Reicht das nicht, brauchst du mehr Logilk. Ich selber realisiere grad ein Projekt mit gescannten Belegen, die wir selber erstellt haben. Ort des Barcodes ist hier bekannt. Sind in C# nur 2 Zeilen. Bzw. in Powershell. Um die Genauigkeit - und da der Barcode Ort bekannt ist - zu verbessern, nutze ich Rectangle für die Bildbearbeitung. Damit ziehe ich ein Quadrat über den Bereich und übergebe nur den an die Barcode Reader DLL.

Hier nutze ich eine ältere. Man kann 100 oder 500 und mehr Durchgänge einstellen. Auch dunkle Büchrücken erkennt die DLL. Finde es recht gut. Je nach Anzahl der Durchgänge und Schwierigkeit bekommt man einen Array mit ALLEN Barcdoes zurück. Mitunter ist die Nummer auch doppelt. Kann man Filtern.

Ohne Barcode hilft das dir ggf. bedigt! Da die Lokation doch meist oben rechts ist, könntest du damit Tesseract untersützten und nur die relevanten Daten übergeben. Wobei sich komplette OCR schon lohnt. Es added einen Textstream zum PDF und macht es durchsuchbar.

Eine Area wie mit Rectangle hätte den Vorteil, dass du hier explizit ein O "Oh" in 0 "Null" konvertieren kannst. Falls es mal Amok läuft und aus Zahlen Buchstaben macht. Mit Nullen und den Buchstaben O dürften eh viele Prrobleme haben.

Ggf. hat die Rechnung ja schon einen Barcode. Wenn die nicht gerade kryptisch unterwegs sind, kann man ggf. Belegnummer und Datum daraus ziehen.

Ich hab leider noch nicht viel mit OneDrive etc. gemacht. Denke aber die API sollte alles hergeben. Bzw. manipulierst Du die Dateinamen vorher mit PowerShell.

Die Erkennng bei den Barcode, wie oben beschrieben, lief bei mir < 1 Sekunde. Die Frage ist, ob Zeit überhaupt dann eine Rolle spielt. Würde - wenn ich es selber progge - eher versuchen so sauber wie möglich Datum etc. zu bekommen.

Da wir in der Verarbeitung sind, kannst du auch auf Plausibiliät prüfen! Rechnung aus 1955 macht wenig Sinn. So könnte man schon ein paar Ausreißer einfangen.

Übrigens benutze ich für Rectangle einen Clone. Org. Bild bleibt erhalten. Du kannst es also in 1x Druchlauf durch 2x Funktionen schicken. Einmal nur mit Konzentration auf den rechten, oberen Bereich. Einmal für Volltext.

Unter Ubuntu wäre das schöne, dass es da schon Tools gibt, die PDF in IMG und an Tesseract übergeben. Linux oder Linux Subsystem unter Winodws Server sind nicht jedermanns Sache. PowerShell kann belieibige managementbare DLLs laden. Call zu public static ist nur ein 1 Zeiler.

Bei Interesse kann ich den Barcode Reader mal posten. Ohne Barcode wie gesagt zumindest die Rectangle Aufteilung nutzbar.

Tesseract gibt es auch für MacOS: https://fynder.de/tutorial/mac-osx-kostenlose-texterkennung-tesseract-oc ...

Die Frage ist, ob die iOS App alles können soll, oder Du später nachverarbeiten willst. Bei der letzten Variante bist du frei unter Linux, MacOS oder Windows unterwegs......

mfg Crusher
Member: Visucius
Visucius Aug 08, 2022 at 13:49:37 (UTC)
Goto Top
@transocean:
Ja, Scanner Pro habe ich selber und u.a. mit Genius Scan habe getestet. Das Problem war, dass ich die fortlaufende Nummierung nicht automatisiert bekomme und auch eine Lösung über den Upload zu OneDrive nicht klappte, weil sich die Dokumente mit gleichem Namen ( z.B. Jahr_Monat) automatisch überschreiben.
Habe aber jetzt - mit ScannerPro - einen Workaround gefunden: Bei der lokalen Speicherung innerhalb eines Ordners legt er die Dokumente mit fortalufender Numierung an. Das müsste eigentlich auch im Tagesgeschäft funktionieren. Wir werden das jetzt einfach mal ne zeitlang testen, ob sich das bewährt.


@Crusher79:
Danke Dir Crusher, ich hatte sowas schon gefunden, z.B. siehe Links für Anwälte. In dem gewünschten Einsatz-Zweck wäre das vom Arbeitsablauf aber ziemlich einschränkend. Die iPad-App kann ich am Arbeitsplatz nutzen, gleich noch die Kontierung notieren und die fortlaufende Nummierung auf dem Original vermerken und dieses gleich ablegen. Da will ich nicht vom Scanner zum Arbeitsplatz usw.
https://www.lto.de/recht/legal-tech/l/legal-tech-innovation-pdf-scan-umb ...
Member: micneu
micneu Aug 11, 2022 at 17:08:17 (UTC)
Goto Top
schau dir mal "Microsoft lens" an, die macht (nach meinem geschmack) ganz gute ergebnisse
Member: Visucius
Visucius Aug 12, 2022 at 09:39:25 (UTC)
Goto Top
Nee, das is nix. Das ist schon rausgeflogen, weil man die Namensgebung nicht vordefinieren kann.

Im Anschluss wird man auch noch auf OneDrive verwiesen, welches genauso unflexibel ist aber als Krönung bei jedem Wackler nachfragt, ob man nicht nen Feedback schicken möchte.

Für sowas fehlt mir echt Verständnis, Lebenszeit - und Nerven face-wink

Der Markt ist überraschend überschaubar - lieber werben 45 Scanner-Apps damit, dass sie die Quittungen doch ein minimales wenig more crispy einscannen als die 44 anderen.