[Gelöst] Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Stevo · Beitrag von **Stevo** » 18.03.2022 15:46:45

Hallo zusammen,

vielleicht liegts am Alter oder ich blick es nicht

Ich erzeuge mit gimagereader aus verschiedensten gescannten Dokumenten jeweils PDF-Dokumente mit dem Bild als Inhalt sowie unsichtbarer Textlage um es Durchsuchen zu können.

Das funktioniert richtig gut bis auf folgendes:

In der Ansicht mit dem Dokumentbetrachter ist diese Textlage auch unsichtbar, nur beim Drucken nicht. Je nachdem wie exakt das Dokument nachgebildet wurde, ist der Text der "unsichtbaren" Textlage mehr oder weniger störend bis "voll Panne" beim Ausdruck, so lassen geht jedenfalls nicht.

Da ich die Dokumente zum Archivieren scanne, ist mir die maschinelle Durchsuchbarkeit UND die Möglichkeit des "einwandfreien" Ausdrucks wichtig. Nur wie bekomme ich das hin?

Benutzt wird:
Debian 11 Bullseye im aktuellen Stand
gimagereader 3.3.1-1+b2 aus dem Debian Repo
tesseract-ocr und libtesseract 4 4.1.1-2.1
tesseract-deu, -eng und -osd mit Stand 1:4.00~git30-7274cfa-1.1

gedruckt wird über CUPS auf einem Laserjet 4 Plus über die JetDirect Netzwerkkarte. Der Drucker macht sonst keine Zicken.
Die mit dem HP zusammenhängenden Pakete wie printer-driver-hpijs oder printer-driver-hpcups etc. sind in Version 3.21.2+dfsg1-2

Ich habe schon viel gesucht, ob ich da etwas verstellen kann, ob das ein bekannter Bug ist, aber entweder benutze ich die falschen Suchbegriffe oder siehe ganz oben

Für Hilfe bin ich sehr dankbar

Stefan

eggy · Beitrag von **eggy** » 18.03.2022 22:50:48

Versuch doch mal, ob drucken aus nem anderen pdfviewer heraus bessere Resultate bringt.

Stevo · Beitrag von **Stevo** » 19.03.2022 00:06:53

Gute Idee, aber das ergibt das selbe Resultat. Probiert hab ich Libreoffice Draw.

Es liegt wohl am Dokument bzw wie es erzeugt wird.Nur wie und mit welcher Einstellung in gimagereader stell ich das ab?

Edit: Oder es liegt am Druckertreiber. Drucke ich es mit dem über Cups als Laserjet 4 Plus eingerichteten Drucker aus , ergibt es den unschönen Ausdruck.
Ich hab hplip installiert und noch einen Drucker eingerichtet, der auf das selbe Gerät geht, aber nicht auf die Ip Adresse des Druckers druckt sondern über das HP Druckertool auf localhost (die Angaben hab ich aus den Druckereigenschaften aus "Einstellungen" - ich weiß gar nicht mehr wie ich den zweiten Drucker eingerichtet habe). Drucke ich über den dann ist der Ausdruck korrekt.

Schau ich über CUPS http://localhost:631/printers/ nach, sehe ich dort für diesen Drucker

über CUPS eingerichtet mit Treiber HP LaserJet 4 Plus hpijs pcl3, 3.21.2 gibt falsches Resultat (aber nur bei dem auf diese Weise generierten PDF)

über das HP Druckertool eingerichtet mit Treiber HP LaserJet 4 Plus pcl3, hpcups 3.18.12 das korrekte Druckresultat

Hmmm ...

eggy · Beitrag von **eggy** » 19.03.2022 00:43:27

Ich hätte erwartet, dass es daran liegt, welche renderlib (cairo etc) genutzt wird.
Wenn ich das richtig auf dem Schirm hab, ist gimagereader nen Frontend für tesseract?
Dann könntest Du mal schauen, mit welchen Parametern bzw. ob Du da nen PDF mit anderen Inhalten erzeugen lassen kannst.

Stevo · Beitrag von **Stevo** » 19.03.2022 01:26:47

Ich hab mein Posting editiert, aber leider lang dafür gebraucht. Liegt scheints am Drucker ... aber wieso ob es am hp-cups oder ijs liegt oder an den verschiedenen Versionen, kann ich noch nicht sagen. ich muss jetzt ins Bett ...

Stevo · Beitrag von **Stevo** » 19.03.2022 21:16:38

Ok, ich kann bestätigen, dass es am Druckertreiber liegt.

Mit dem hpijs geht es nicht, d.h. hier wird die unsichtbare Textlage der PDF Datei gedruckt. Beim hpcups ist das nicht der Fall. Die Version spielt keine Rolle, die Angabe der alten Version 3.18.12 beim hpcups, die ich gestern unter http://localhost:631/printers/ gepostet hatte,isPS Frontend die nicht der aktuellen Version entsprach. Nachdem ich heute die Druckerbezeichnungen angepasst habe, wird jetzt dort auch die 3.21.2 angezeigt.

Also ein Treiberproblem. Der hpijs ist wohl zu alt.

Manchmal muss man wohl ein Problem fürs Forum formulieren um auf die richtigen Gedanken zu kommen. Danke für den "Stupser" zum anderen Viewer, da bin ich auf die Idee gekommen mal den anderen Druckertreiber zu nehmen.

eggy · Beitrag von **eggy** » 19.03.2022 21:35:00

Stevo hat geschrieben:
19.03.2022 21:16:38
Manchmal muss man wohl ein Problem fürs Forum formulieren um auf die richtigen Gedanken zu kommen.

Ganz normal ... https://en.wikipedia.org/wiki/Rubber_duck_debugging

debianforum.de

[Gelöst] Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

[Gelöst] Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Re: [Gelöst] Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit