Buch Scan

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
abc
Beiträge: 60
Registriert: 02.08.2015 11:44:01

Buch Scan

Beitrag von abc » 03.10.2016 01:08:21

Hallo


Kennt ihr ein Scanprogramm mit Batchfunktion, d.h. z.B. 300 Scan "am Stück", mit nur x Sekunden Pause zum händigen Seitenwechsel und alles in einer PDF zu speichern.

Merci vielmal!

thoerb
Beiträge: 1677
Registriert: 01.08.2012 15:34:53
Lizenz eigener Beiträge: MIT Lizenz

Re: Buch Scan

Beitrag von thoerb » 03.10.2016 04:14:55

Ich glaube das wird gar nicht so einfach wie du dir das vielleicht vorstellst.

Ich habe so etwas im Kleinen mal mit Debiantesseract-ocr gemacht und kann dir sagen, du brauchst anschließend für die Fehlerkorrektur wesentlich mehr Zeit als für das Scannen selbst. Meine Empfehlung, versuche beim Scannen die beste mögliche Qualität herauszuholen, das spart dir später viel Zeit und Arbeit. Du solltest darauf achten, dass jede Buchseite beim Scannen absolut gerade auf dem Scanner aufliegt und optimal gescannt wird.

Ich habe dann damals alle Seiten als durchnummerierte Bilddateien in einem Verzeichnis gespeichert und habe anschließend über alle Bilder Tesseract drüber laufen lassen und in eine Textdatei gespeichert. In dieser Textdatei befinden sich dann jede Menge Fehler, die erst mal korrigiert werden müssen. Wenn du das dann soweit hast, kannst du das ganze z.B. mit Latex in ein PDF ausgeben.

Das wäre mal ganz grob meine Überlegung, wie ich die Sache angehen würde.

DeletedUserReAsG

Re: Buch Scan

Beitrag von DeletedUserReAsG » 03.10.2016 07:32:13

Wenn OCR nicht gebraucht wird, würde ich mir was Passendes mit sane basteln. Da sollte man nicht mehr als einige Zeilen benötigen.

OT: wenn es nicht gerade ein dedizierter Buchscanner, sondern ein handelsüblicher Flachbettscanner ist, wäre vielleicht auch das Abphotographieren eine Überlegung wert. Mit einem einfachen Setup (Stativ, Licht, Auflage für Buch, Fernauslöser, brauchbarer Fotoapparat mit Möglichkeit, Fokus und Blende manuell einzustellen) und etwas automatisiertem Postprocessing kann man eine Qualität erreichen, die sich beim Druck auf A4 nicht wirklich von einem Scan unterscheidet – bei unter einer Sekunde pro Seite, wenn man etwas Übung hat, und zudem erheblich buchschonender.

geier22

Re: Buch Scan

Beitrag von geier22 » 03.10.2016 14:23:34

Versuche es mal mit Debiangscan2pdf. Debian tesseract-ocr kannst du integrieren, und Batch-Scannen vom Flachbett wird auch unterstützt.
Beschreibung:
http://gscan2pdf.sourceforge.net/

abc
Beiträge: 60
Registriert: 02.08.2015 11:44:01

Re: Buch Scan

Beitrag von abc » 06.10.2016 13:50:09

Vielen Dank für die Rückmeldungen.

Das gscan2pdf ist das Richtige für mich. Man kann die Seitenzahl zuvor einstellen und dann läuft es durch...
(OCR optional, habe es noch nicht getestet.)

Allerdings klappte der PDF Export nicht.

Es funktioniert über Drucken, in Datei drucken... Das ist ok. Ziel errreicht!

Merci vielmal!

Benutzeravatar
desputin
Beiträge: 1274
Registriert: 24.04.2015 17:16:34

Re: Buch Scan

Beitrag von desputin » 18.05.2017 15:36:18

https://www.daswirdmanjawohlnochsagenduerfen.de
https://www.neoliberalyse.de - Über die Ökonomisierung aller Lebensbereiche. |

Antworten