OCR für Fragebögen

Du hast Probleme mit Deinem eMail-Programm, Webbrowser oder Textprogramm? Dein Lieblingsprogramm streikt?
Antworten
MoonKid
Beiträge: 513
Registriert: 12.03.2012 22:36:43

OCR für Fragebögen

Beitrag von MoonKid » 30.01.2014 10:23:19

OCR für Linux gibt es ja zu Haufen. Hab bisher nix brauchbares gefunden.

Ich möchte mehrere 100 Fragebögen (je 5 Seiten) mit Checkboxen, handgeschriebenen Zahlen usw. einscannen bzw. als PDF ins Programm schieben. Am Ende soll dann einfach eine Datendatei (cvs, oder was anderes konvertier-/importierbares) rauskommen.

Notwendig ist eine manuelle Kontrolle. Ich will bei jedem Scan/PDF sehen, welche Werte er da tatsächlich für die Felder "gesehen" hat.

Benutzeravatar
fragenfrager
Beiträge: 658
Registriert: 31.12.2003 08:47:15

Re: OCR für Fragebögen

Beitrag von fragenfrager » 30.01.2014 15:29:43

Hast du denn schon einen Test mit einem Fragebogen gemacht?
Meine OCR Erfahrung beschränkt sich auf solch einen Test und da war ich nicht wirklich glücklich mit dem Ergebnis. Handgeschrieben und scan gibt noch mehr mögliche Fehlerquellen.

Teste es doch einfach mal und schau dir das Ergebnis an, dann kannst weiter überlegen, so würd ich es machen.

Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Re: OCR für Fragebögen

Beitrag von Luxuslurch » 30.01.2014 15:40:57

Interessant ist das auf alle Fälle. Ich kenne z.B. an der Hochschule, wo Evaluationsbögen zum ankreuzen "maschinell ausgewertet" werden. Da beschränkt man sich allerdings natürlich auf's ankreuzen, also statt einem Feld für Zahlen eine Skala von 1 bis 10. Das ist eher zu bewältigen für ein Programm.

Das heißt nicht, dass es theoretisch nicht möglich ist. Allerdings kenne ich kein System, welches das könnte (und wäre an einer Lösung auch interessiert).
Debian Stable.
Der Mod spricht rot.

MoonKid
Beiträge: 513
Registriert: 12.03.2012 22:36:43

Re: OCR für Fragebögen

Beitrag von MoonKid » 30.01.2014 16:35:54

fragenfrager hat geschrieben:Teste es doch einfach mal und schau dir das Ergebnis an, dann kannst weiter überlegen, so würd ich es machen.
Bei allem Respekt: Es geht in diesem Thread nicht um Sinn und Unsinn von Fragenbogenauswertung per OCR. Das war nicht die Frage. Btw: Unter Win habe ich bereits FormPro angetestet. Ist erstmal nett, aber muss sich in der Praxis noch bewähren.
fragenfrager hat geschrieben:Meine OCR Erfahrung beschränkt sich auf solch einen Test und da war ich nicht wirklich glücklich mit dem Ergebnis. Handgeschrieben und scan gibt noch mehr mögliche Fehlerquellen.
Genau es geht um die Software. Du erwähnst hier eine, aber nennst ihren Namen nicht, obwohl genau das Sinn des Threads ist. ;)

Es kommt darauf an, mit welcher Erwartungshaltung an so eine SW geht. Fehler gehören dazu und eben deswegen suche ich passende SW, die mir eine möglichst effiziente Möglichkeit der Nachkontrolle bietet.
Simpel wäre hier eine visuelle Darstellung jedes scans und einem overlay der extrahierten Daten.

Benutzeravatar
fragenfrager
Beiträge: 658
Registriert: 31.12.2003 08:47:15

Re: OCR für Fragebögen

Beitrag von fragenfrager » 03.02.2014 18:13:44

ich denke es war Debiangocr.
Die Ergebnisse bei mir waren abhängig von Qualität und Rotation des Bildes/Scans. Jedenfalls waren immer viele Fehler im Outputfile. Villeicht können da bestimmte Optionen helfen.

Das mit dem overlay klingt sogar interessant. Programmiertechnisch kenn ich mich da leider zu wenig aus aber ich stelle mir das dann so vor:
  • ocr ließt Daten ein
  • ocr verarbeitet Daten UND merkt sich die Position(Koordinaten) im scan
  • Erzeugung von gleichgroßen Bild in dem die Ergebnisdaten der ocr Verarbeitung an die jeweiligen Koordinaten abgebildet werden.
Da fällt mir ein, es gibt auch Bildvergleichssoftware, also vergleiche Bild1 mit Bild2 (oder einfach imagemagick mit irgendeinem filter)
Das könnte man nutzen um das immer gleichbleibende Formular zu "entschärfen" und nur die notwendigen Daten darzustellen.

jedenfalls viel Erfolg wünsch ich dir, darfst gern Bescheid sagen wie du es dann gelöst hast ;)

Antworten