[Gelöst] Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Einrichten des Druckers und des Drucksystems, Scannerkonfiguration und Software zum Scannen und Faxen.
Antworten
Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

[Gelöst] Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Beitrag von Stevo » 18.03.2022 15:46:45

Hallo zusammen,

vielleicht liegts am Alter oder ich blick es nicht ;-)

Ich erzeuge mit gimagereader aus verschiedensten gescannten Dokumenten jeweils PDF-Dokumente mit dem Bild als Inhalt sowie unsichtbarer Textlage um es Durchsuchen zu können.

Das funktioniert richtig gut bis auf folgendes:

In der Ansicht mit dem Dokumentbetrachter ist diese Textlage auch unsichtbar, nur beim Drucken nicht. Je nachdem wie exakt das Dokument nachgebildet wurde, ist der Text der "unsichtbaren" Textlage mehr oder weniger störend bis "voll Panne" beim Ausdruck, so lassen geht jedenfalls nicht.

Da ich die Dokumente zum Archivieren scanne, ist mir die maschinelle Durchsuchbarkeit UND die Möglichkeit des "einwandfreien" Ausdrucks wichtig. Nur wie bekomme ich das hin?

Benutzt wird:
Debian 11 Bullseye im aktuellen Stand
gimagereader 3.3.1-1+b2 aus dem Debian Repo
tesseract-ocr und libtesseract 4 4.1.1-2.1
tesseract-deu, -eng und -osd mit Stand 1:4.00~git30-7274cfa-1.1

gedruckt wird über CUPS auf einem Laserjet 4 Plus über die JetDirect Netzwerkkarte. Der Drucker macht sonst keine Zicken.
Die mit dem HP zusammenhängenden Pakete wie printer-driver-hpijs oder printer-driver-hpcups etc. sind in Version 3.21.2+dfsg1-2

Ich habe schon viel gesucht, ob ich da etwas verstellen kann, ob das ein bekannter Bug ist, aber entweder benutze ich die falschen Suchbegriffe oder siehe ganz oben ;-)

Für Hilfe bin ich sehr dankbar

Stefan
Zuletzt geändert von Stevo am 19.03.2022 21:17:30, insgesamt 1-mal geändert.

eggy
Beiträge: 3331
Registriert: 10.05.2008 11:23:50

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Beitrag von eggy » 18.03.2022 22:50:48

Versuch doch mal, ob drucken aus nem anderen pdfviewer heraus bessere Resultate bringt.

Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Beitrag von Stevo » 19.03.2022 00:06:53

Gute Idee, aber das ergibt das selbe Resultat. Probiert hab ich Libreoffice Draw.

Es liegt wohl am Dokument bzw wie es erzeugt wird.Nur wie und mit welcher Einstellung in gimagereader stell ich das ab?

Edit: Oder es liegt am Druckertreiber. Drucke ich es mit dem über Cups als Laserjet 4 Plus eingerichteten Drucker aus , ergibt es den unschönen Ausdruck.
Ich hab hplip installiert und noch einen Drucker eingerichtet, der auf das selbe Gerät geht, aber nicht auf die Ip Adresse des Druckers druckt sondern über das HP Druckertool auf localhost (die Angaben hab ich aus den Druckereigenschaften aus "Einstellungen" - ich weiß gar nicht mehr wie ich den zweiten Drucker eingerichtet habe). Drucke ich über den dann ist der Ausdruck korrekt.

Schau ich über CUPS http://localhost:631/printers/ nach, sehe ich dort für diesen Drucker
  • über CUPS eingerichtet mit Treiber HP LaserJet 4 Plus hpijs pcl3, 3.21.2 gibt falsches Resultat (aber nur bei dem auf diese Weise generierten PDF)
  • über das HP Druckertool eingerichtet mit Treiber HP LaserJet 4 Plus pcl3, hpcups 3.18.12 das korrekte Druckresultat
Hmmm ...
Zuletzt geändert von Stevo am 19.03.2022 01:23:47, insgesamt 1-mal geändert.

eggy
Beiträge: 3331
Registriert: 10.05.2008 11:23:50

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Beitrag von eggy » 19.03.2022 00:43:27

Ich hätte erwartet, dass es daran liegt, welche renderlib (cairo etc) genutzt wird.
Wenn ich das richtig auf dem Schirm hab, ist gimagereader nen Frontend für tesseract?
Dann könntest Du mal schauen, mit welchen Parametern bzw. ob Du da nen PDF mit anderen Inhalten erzeugen lassen kannst.

Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Beitrag von Stevo » 19.03.2022 01:26:47

Ich hab mein Posting editiert, aber leider lang dafür gebraucht. Liegt scheints am Drucker ... aber wieso ob es am hp-cups oder ijs liegt oder an den verschiedenen Versionen, kann ich noch nicht sagen. ich muss jetzt ins Bett ... ;-)

Stevo
Beiträge: 20
Registriert: 17.09.2018 20:00:16

Re: Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Beitrag von Stevo » 19.03.2022 21:16:38

Ok, ich kann bestätigen, dass es am Druckertreiber liegt.

Mit dem hpijs geht es nicht, d.h. hier wird die unsichtbare Textlage der PDF Datei gedruckt. Beim hpcups ist das nicht der Fall. Die Version spielt keine Rolle, die Angabe der alten Version 3.18.12 beim hpcups, die ich gestern unter http://localhost:631/printers/ gepostet hatte,isPS Frontend die nicht der aktuellen Version entsprach. Nachdem ich heute die Druckerbezeichnungen angepasst habe, wird jetzt dort auch die 3.21.2 angezeigt.

Also ein Treiberproblem. Der hpijs ist wohl zu alt.

Manchmal muss man wohl ein Problem fürs Forum formulieren um auf die richtigen Gedanken zu kommen. Danke für den "Stupser" zum anderen Viewer, da bin ich auf die Idee gekommen mal den anderen Druckertreiber zu nehmen.

eggy
Beiträge: 3331
Registriert: 10.05.2008 11:23:50

Re: [Gelöst] Drucken von über gimagereader erzeugten PDF Dateien druckt den unsichtbaren Textlayer mit

Beitrag von eggy » 19.03.2022 21:35:00

Stevo hat geschrieben: ↑ zum Beitrag ↑
19.03.2022 21:16:38
Manchmal muss man wohl ein Problem fürs Forum formulieren um auf die richtigen Gedanken zu kommen.
Ganz normal ... https://en.wikipedia.org/wiki/Rubber_duck_debugging :mrgreen:

Antworten