Grösse der gescannten PDF-Dateien

Einrichten des Druckers und des Drucksystems, Scannerkonfiguration und Software zum Scannen und Faxen.
Benutzeravatar
KBDCALLS
Moderator
Beiträge: 22355
Registriert: 24.12.2003 21:26:55
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Re: Grösse der gescannten PDF-Dateien

Beitrag von KBDCALLS » 25.11.2018 19:28:34

Das Perlgewürge funktioniert aber auch nicht richtig. Da ist dan aber schon Xsane lieber , denn das tut das was es soll. Und ob ein PDF jetzt 4 MB , 8MB oder größer ist sollte bei den heutigen Festplattengrößen auch nicht mehr so die große Rolle spielen.
Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.

EDV ist die Abkürzung für: Ende der Vernunft

Bevor du einen Beitrag postest:
  • Kennst du unsere Verhaltensregeln
  • Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.

wanne
Moderator
Beiträge: 7448
Registriert: 24.05.2010 12:39:42

Re: Grösse der gescannten PDF-Dateien

Beitrag von wanne » 26.11.2018 11:40:47

rhHeini hat geschrieben: ↑ zum Beitrag ↑
25.11.2018 15:53:02
in denen aber schon eine Komprimierung hinterlegt ist (speichere PDF zlib komprimiert).
Dann werden die Bilder vermutlich mit den Filter "FlateDecode" komprimiert. Der entspricht in Teilen wohl png.
Hat den Vorteil das das lossless ist (also wirklich genau das angezeigt wird, was gescannt wurde) ist aber auf der anderen Seite eher groß. (Vor allem auch weil jedes Rauschen das der Scanner produziert mit abgespeichert wird.)
Wenn du WebM jpeg2000 oder jpeg (oder DCTDecode) nutzt wirst du um Größenordnungen kleinere Dateien bekommen.
Eingebettet in ein PDF hat sich halt als ein gewisser Standard etabliert.
Wobei das Standard nur für den Namen gilt. Es gibt derartig viele PDF-Formate und Arten die zu erstellen, dass da ganz gerne eigentlich halt nichts gleich ist als die Dateiendung.
rot: Moderator wanne spricht, default: User wanne spricht.

debianoli
Beiträge: 4068
Registriert: 07.11.2007 13:58:49
Wohnort: Augschburg

Re: Grösse der gescannten PDF-Dateien

Beitrag von debianoli » 26.11.2018 14:50:59

KBDCALLS hat geschrieben: ↑ zum Beitrag ↑
25.11.2018 19:28:34
Das Perlgewürge funktioniert aber auch nicht richtig. Da ist dan aber schon Xsane lieber , denn das tut das was es soll.
Meinst du gscan2pdf? Was geht bei dem Programm nicht richtig?

Ich nehme das lieber als xsane, da ich die Oberfläche besser und intuitiver in der Bedienung finde. Für das Scannen von Dokumenten zur Archivierung als PDF reicht das Dicke. Für spezielle Scannereien nehme ich Vuescan.

Benutzeravatar
KBDCALLS
Moderator
Beiträge: 22355
Registriert: 24.12.2003 21:26:55
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Re: Grösse der gescannten PDF-Dateien

Beitrag von KBDCALLS » 26.11.2018 16:10:38

Will ich damit Scannen sind alle Reiter außer Seitenoptionen erst einmal leer . Also Scanmodus Erweitert usw. Und das ist nicht gerade prickelnd. Entweder muß ich eine Seite scannen dann erscheinen die restlichen Option oder ich lösche die rc Datei dann starte dann gscan2pdf Und ob jetzt Plasma Perl oder sonstwer das Problem dabei ist im Prinzip egal. Es funktioniert nicht so wie es soll.
Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.

EDV ist die Abkürzung für: Ende der Vernunft

Bevor du einen Beitrag postest:
  • Kennst du unsere Verhaltensregeln
  • Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.

willy4711

Re: Grösse der gescannten PDF-Dateien

Beitrag von willy4711 » 26.11.2018 18:10:02

Hab auch mal einen Test gemacht : Die Programme sind aus den Dateinahmen ersichtlich.

Wenn ich im Modus "Strichzeichnung" (Master PDF Editor "lineart") scanne,
unterscheiden sich die Programme kaum. (na ja - 139 kB zu 316 kB ist ja auch was)

Xsane hat einfach zu viele Einstellungsmöglichkeiten, als dass man ohne sich fachlich umfassend einzuarbeiten was vernünftiges produzieren könnte. Soweit das Scannen als Strichzeichnung reicht, der einzige Modus, wo man gleich loslegen kann, ohne
gross was einzustellen.

Die Dateien mit "optimiert " wurden mit dem Master PDF Editor als optimiertes PDF gespeichert.
Die Differenzen sind erheblich, wenn auch kostenpflichtig.

Die Bildqualität unterscheidet sich auch von Programm zu Programm (finde ich jedenfalls)
Die Dateigröße ist aber selbst bei Strichzeichnungen immerhin um den Faktor 2 -3 unterschiedlich.

Am einfachsten zu handeln ist da der Master-PDF-Editor, da das Abspeichern im "optimierten Format"
ein Arbeitsschritt ist- Scannen ---> speichern.
Für berufliche Zwecke könnte das eine Lösung sein, da das Optimieren bei der Gratis-Version ein Wasserzeichen hinterlässt :evil: )
Oder man sieht darüber hinweg :roll:

Code: Alles auswählen

51K    Nov 26 16:00 gscan2pdf_ 600_DPI_Strichz_jpeg_ Optimiert .pdf [1]
316K   Nov 26 01:00 gscan2pdf_ 600_DPI_Strichz_jpeg.pdf [2]
50K    Nov 26 15:23 Masterpdf editor 600 DPI Lineart optimiert.pdf [3]
139K   Nov 26 15:14 Masterpdf editor 600 DPI Lineart .pdf [4]
1 2,0M Nov 26 14:55 Simplescan 600 DPI.pdf
1 9,5M Nov 26 15:00 xsane 600 DPI Farbe voller Farbumfang.pdf
1 5,1M Nov 26 14:59 xsane 600 DPI Graustufen Voller Farbumfang.pdf
267K   Nov 26 15:01 xsane 600 DPI Strichzeichnung.pdf
Mal ein Vergleich "Strichzeichnungsmodus (ich hoffe nicht mit den Nummern durcheinander gekommen zu sein):
Bei den optimierten sind Wasserzeichen sichtbar (gratis-Version)

[1]Bild
[2]Bild
[3]Bild
[4]Bild
Zuletzt geändert von willy4711 am 26.11.2018 22:38:11, insgesamt 1-mal geändert.

wanne
Moderator
Beiträge: 7448
Registriert: 24.05.2010 12:39:42

Re: Grösse der gescannten PDF-Dateien

Beitrag von wanne » 26.11.2018 22:18:51

Also ich sehe 4 mal ein jpeg mit 700kiB. Mit dem kleinen Unterschied, dass das oberste keine Buchstaben mehr enthällt sondern nur noch pixelmatsch.
Zum Vergleich: Hier eine durch ghostscript gejagte:

Code: Alles auswählen

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.3 -dBATCH -dNOPAUSE -dQUIET -sProcessColorModel=DeviceGray -sColorConversionStrategy=Gray -dOverrideICC -sOutputFile=output.pdf -dFIXEDMEDIA -dEmbedAllFonts=false testfile.pdf;
Ja. Das ist böse optimiert. Aber so schlimm ist da gar nicht. Die gs Kommandos sind halt immer ewig lang. Schon alleine damit man nicht 5k Outputzeilen bekommt.
https://nextcloud.zdv.uni-tuebingen.de/ ... j/download
34K und ansatzweise dem Original entsprechend.
rot: Moderator wanne spricht, default: User wanne spricht.

wanne
Moderator
Beiträge: 7448
Registriert: 24.05.2010 12:39:42

Re: Grösse der gescannten PDF-Dateien

Beitrag von wanne » 26.11.2018 22:53:35

Hier noch ein webp davon (43kiB):

Code: Alles auswählen

ffmpeg.static -i Pic.png -s 1275x1650 -compression_level 6 -qscale 1 -preset text -y out.webp
https://nextcloud.zdv.uni-tuebingen.de/ ... i99KWcBwZH
rot: Moderator wanne spricht, default: User wanne spricht.

willy4711

Re: Grösse der gescannten PDF-Dateien

Beitrag von willy4711 » 26.11.2018 23:10:37

wanne hat geschrieben: ↑ zum Beitrag ↑
26.11.2018 22:18:51
Also ich sehe 4 mal ein jpeg mit 700kiB. Mit dem kleinen Unterschied, dass das oberste keine Buchstaben mehr enthällt sondern nur noch pixelmatsch.
Zum Vergleich: Hier eine durch ghostscript gejagte:
Ja das überzeugt. :THX:

Zu den 700 kB: Leider gibt es mit pdf- Files Probleme bei Imgur: Die lassen sich nicht vergrößern. Deshalb musste sie daher
erstmal nach jpg - umwandeln.

Meine Einwände:

Ich wehre mich dagegen , mich zuerst in die Syntax von irgendwelchen Tools (hier: ghostscript) einarbeiten zu müssen.
Es ist mal wieder traurig, dass solche Ergebnisse, wie du da präsentiert hast, anscheinend nur auf der Kommandozeile zu erreichen sind.

Irre - Da gibt es anscheinend sehr leistungsfähige Tools. Da gibt es wahrscheinlich in Linux Foren hunderte von Threads,
die sich mit dieser Problematik beschäftigen. Aber niemand kommt auf die Idee hier mal ein für "Otto Normalverbraucher"
eine GUI dafür zu entwickeln.

Ich hätte ja noch xsane anfügen können, aber das PDF xsane 600 DPI Strichzeichnung.pdf
sieht genauso beschissenen aus, ist bloß doppelt so groß wie das vom Master PDF Editor.

Besser wird es erst ab 2 MB aufwärts mit GUI- Verfahren.

Mal wieder ein schlagender Beweis für die Anwenderfeindlichkeit von Linux , was PDF betrifft. :twisted: :facepalm:

wanne
Moderator
Beiträge: 7448
Registriert: 24.05.2010 12:39:42

Re: Grösse der gescannten PDF-Dateien

Beitrag von wanne » 27.11.2018 00:46:07

Zu den 700 kB: Leider gibt es mit pdf- Files Probleme bei Imgur: Die lassen sich nicht vergrößern.
Deswegen würde ich die Finger von Imgur lassen. Wenn schon mit Werbung dann halt gleich https://zippyshare.com/, Mega.nz upload.cat filerio.in oder so.
Dann bekommt der Downloader wenigstens, was du hochgeladen hast.
Es ist mal wieder traurig, dass solche Ergebnisse, wie du da präsentiert hast, anscheinend nur auf der Kommandozeile zu erreichen sind.
Da wäre ich mir nicht so sicher.
Ich referiere halt die Kommandozeile und kenne kaum passende GUI-Tools. Wobei mich mal stark interessieren würde, was xsane so anzeigt. Leider sehe ich das nicht, solange mein Scanner nicht angeschlossen ist.
Ich würde mal tippen, dass z.B. incscape da viel hinbekommt, wenn man weiß wie.
Btw. haben die jpegs genau 300dpi. Ich tippe, dass auch master-PDF die beschert hohen dpi-Zahlen ignoriert.
Aber prinzipiell gebe ich dir recht:
Mal wieder ein schlagender Beweis für die Anwenderfeindlichkeit von Linux , was PDF betrifft
Du hast ja schon kostenpflichtige tools genannt. Aber PDF ist halt ein extrem hässliches Format. Da setzt sich kaum jemand ohne Geld dafür zu bekommen mit auseinander. Entsprechend wenig Tools gibt es für nicht zahlende Anwender. Und ein Drucker (und damit Xerox oder HP die die "Pro" version von ghostscript kaufen) braucht halt keine GUI.
Deswegen auch meine Empfehlung zu "echten" Bildformaten. Das sind halt deutlich angenehmere Formate und entsprechend gibt es dafür deutlich besseres Tooling. Das gilt btw. auch nicht nur für Linux. Auch unter Windows ist PDF ein Graus.
rot: Moderator wanne spricht, default: User wanne spricht.

debianoli
Beiträge: 4068
Registriert: 07.11.2007 13:58:49
Wohnort: Augschburg

Re: Grösse der gescannten PDF-Dateien

Beitrag von debianoli » 27.11.2018 11:21:07

willy4711 hat geschrieben: ↑ zum Beitrag ↑
26.11.2018 23:10:37
Mal wieder ein schlagender Beweis für die Anwenderfeindlichkeit von Linux , was PDF betrifft. :twisted: :facepalm:
Nö. Ich bevorzuge zwar auch eine einfache UI (siehe gscan2pdf), aber die brauchst du definitiv nicht in diesem Fall. Vor allem, da es sich um immer den gleichen Vorgang handelt: Ein Scan soll hochwertig in ein möglichst kleines PDF verwandelt werden.

In dem Fall kann man sehr gut einen Workflow anlegen:

Alle Scan wandern als Rohdaten in den festgelegten Ordner Input.

Ein Cron-Job prüft den Ordner auf vorhandene Dateien und wandelt diese automatische per ghostscript in PDFs um. Dann verschiebt der Cron-Job die Dateien in Output-Verzeichnisse.

Fertig.

Übrigens ist so was im professionellen Bereich recht häufig anzutreffen.

wanne
Moderator
Beiträge: 7448
Registriert: 24.05.2010 12:39:42

Re: Grösse der gescannten PDF-Dateien

Beitrag von wanne » 27.11.2018 15:50:45

Würde das (wenn überhaupt) auch wie debianoli machen.
Der Umweg über das Bild macht vieles einfacher.
Ein Scan soll hochwertig in ein möglichst kleines PDF verwandelt werden.
Die frage ist, wie "hochwertig" es denn sein Soll. Wenn wir hier von kiB reden wird das nix mit hochwertig.
Und es sollte klar sein, dass beim Verpacken in PDF das Ergebnis immer um einiges Größer wird. Deswegen kamen ja auch meine Frage was erwünscht ist.
Ich wette btw. auch das rhHeinis Windows-Werkzeug auch keine 600dpi abspeichert.
Das ist absoluter Humbug für die Qualität, die übliche Scanner so bringen.
rot: Moderator wanne spricht, default: User wanne spricht.

debianoli
Beiträge: 4068
Registriert: 07.11.2007 13:58:49
Wohnort: Augschburg

Re: Grösse der gescannten PDF-Dateien

Beitrag von debianoli » 27.11.2018 16:11:49

wanne hat geschrieben: ↑ zum Beitrag ↑
27.11.2018 15:50:45
Ich wette btw. auch das rhHeinis Windows-Werkzeug auch keine 600dpi abspeichert.
Das ist absoluter Humbug für die Qualität, die übliche Scanner so bringen.
Laut Canon kann der Lide 220 eine Auflösung von 4.800 dpi mit folgender Einschränkung:
Der hier angegebene Wert entspricht der gemessenen maximalen Abtastauflösung der Hardware auf Grundlage des ISO-Standards 14473. Beim Scannen in hoher Auflösung ist die maximale Scanfläche eingeschränkt.
Siehe https://www.canon.de/scanners/flatbed-s ... ation.aspx

Ich kenne die ISO 14473 nicht und weiß nicht, worauf sich die "maximale Scanflache" bezieht. Aber echte 600 dpi für A4 sollten schon drin sein. Die neueren Scanner bieten eigentlich recht gute Werte für relativ wenig Geld.

wanne
Moderator
Beiträge: 7448
Registriert: 24.05.2010 12:39:42

Re: Grösse der gescannten PDF-Dateien

Beitrag von wanne » 27.11.2018 17:25:37

debianoli hat geschrieben: ↑ zum Beitrag ↑
27.11.2018 16:11:49
Aber echte 600 dpi für A4 sollten schon drin sein.
600 dpi für A4 heißt 2480x4960 Pixel. Oder anders gesagt: Um auf einem Full HD-Monitor die 600dpi darstellen zu können müssen 38% der Seitenbreite die vollen Bildschirmbreite bedecken. Insgesamt darftst du auf deinem Full-HD-Monitor im Vollbildmodus nicht mehr als 17% des Scans anzeigen um die 600dpi genießen zu können.
Mach einfach mal einen Scan auf und stelle die Vergrößerung auf 263%. Und dann fragst du dich, ob das eine sinnvolle Ansicht ist!

4800dpi: 5μm pro Messwert: Diese Auflösung reicht um ein einzelnes Spermium oder einzelne rot blutkörperchen auflösen zu können. ( https://en.wikipedia.org/wiki/Orders_of ... e_(length) )
Beides Sachen, die erst nach der Erfindung des Mikroskops entdeckt wurden. Das soll jetzt auf meinem Scan erkennbar sein?! Das ist garantiert nicht die Qualität, die ich sehe wenn ich mir die üblichen Scans angucke.

Mag sein, dass Canon es schafft, seine Sensorik genau genug zu positionieren, um derartig viele Datenpunkte Sammeln zu können. Vermutlich ist der Sensor klein genug um wirklich nur diese Fläche zwischen den Punkten zu scannen. Mit der Qualität des Scanners hat das nichts mehr zu tun.
Das ist in etwa so sinnvoll, wie wenn die Amerikaner meinen, dass ihre Raketen jetzt Meter genau treffen. Wenn die Intel vor allem auf Hörensagen beruht und nicht zwischen einem Baby und einem Panzer unterscheiden kann nutzt das wenig.

Es kann vielleicht sogar sinnvoll sein wirklich mit der hohen Auflösung zu scannen. (Genau wie es Sinn machen kann wenn man mehrfach Fotografiert.) Wenn man für ein Pixel im Bild 6 Messpunkte hat, kann sich da was vernünftiges raus mitteln.
Abspeichern mit 600dpi ist aber auf jeden Fall Humbug, wenn man Platz sparen will. Deswegen hätte ich gerne mal eine Original-PDF von dem Windowstool gehabt. Ich wette die haben auch ganz fett die Auflösung runter gedreht.

Auch deswegen der Rat zu zwei Schritten. Erstmal scannen und die Originaldaten (png/ppm/bmp) abspeichern und dann mit einem Tool der Wahl gucken wie viel Aufllösung/Qualität sich da wirklich lohnt.
rot: Moderator wanne spricht, default: User wanne spricht.

debianoli
Beiträge: 4068
Registriert: 07.11.2007 13:58:49
Wohnort: Augschburg

Re: Grösse der gescannten PDF-Dateien

Beitrag von debianoli » 27.11.2018 18:03:29

wanne hat geschrieben: ↑ zum Beitrag ↑
27.11.2018 17:25:37
Abspeichern mit 600dpi ist aber auf jeden Fall Humbug, wenn man Platz sparen will. Deswegen hätte ich gerne mal eine Original-PDF von dem Windowstool gehabt. Ich wette die haben auch ganz fett die Auflösung runter gedreht.
300 bis 1.200 dpi sind häufiger benötigte Werte, wenn man Daten für die Druckerei herstellt. Wobei alles über 600 dpi eher im Magazindruck, bei Postern etc zum Einsatz kommt.

Ich habe selber bei bei meinem Scanner testweise schon mal ein Foto mit 2.400 dpi gescannt. Das macht natürlich recht große Dateien. Sinnvoll kann so etwas nur sein, wenn man zB ein altes, sehr schlechtes Foto digital verbessern will, also Milimeter für Milimeter eine Retusche durchführen möchte.
Oder wenn man aus einem Foto ein Poster herstellen möchte. Aber selbst da fällt die Bild-Qualität des Posters mit der Qualität des Ausgangsfotos: Was nicht ursprünglich nicht da war, ist auch durch Vergrößerung nicht da.

wanne
Moderator
Beiträge: 7448
Registriert: 24.05.2010 12:39:42

Re: Grösse der gescannten PDF-Dateien

Beitrag von wanne » 28.11.2018 02:26:42

debianoli hat geschrieben: ↑ zum Beitrag ↑
27.11.2018 18:03:29
300 bis 1.200 dpi sind häufiger benötigte Werte, wenn man Daten für die Druckerei herstellt.
Nicht benötigte Werte. 150dpi sind das was ein üblicher Mensch in angenehmer Leseposition sieht. 600dpi gelten als das was ein übliches gesundes Auge ohne Training erkennen kann, wenn es ganz nahe ran geht. Das verdoppelt eventuell zur Sicherheit (siehe auch Artefakte beim Abtasten) und damit kommt man auf die üblichen Größen beim Druck. Wenn du dein Zeug durch den Drucker haust ist dir das völlig Wurst, wie groß die Auflösung ist. Du könntest prinzipiell noch weit mehr drucken. Das ist keine Abwägung. Es wird schlicht das Maximum von dem genommen, was in irgend einem Fall Sinn machen könnte. So wie du die Wiederholrate/Auflösung von deinem Bildschirm normalerweise nicht runter drehst, obwohl dein Film deutlich weniger hat. Es tut einfach nicht weh den immer am Maximum zu betreiben. Erst wenn du anfängst mit spielen und deine GraKa überfordert ist. fängst du an zu überlegen, ob du jetzt lieber Effekte, Framerate oder Auflösung runter stellst. Normal stimmst du halt auf die schwächste Komponente ab. Beim Druck ist das das Auge. Erst wenn dir auf der anderen Seite Kosten entstehen (in dem Fall Plattenplatz) fährst du das runter.
Wobei alles über 600 dpi eher im Magazindruck, bei Postern etc zum Einsatz kommt.
Das hat noch eine anderen Grund. Das Farbliche Auflösungsvermögen des Auges (Vor allem in Richtung Helligkeit) ist deutlich größer als das was die meisten Geräte schaffen. Mit Dithering kannst du (bei ausreichend gutem Papier) aus dem mehr an Auflösung Farben holen. Das machen sich fast alle Anzeigetechniken zu Nutze. (Auch moderne Grafikkarten und Bildschirme können das.) Macht aber natürlich nur Sinn, wenn das "Ausgabegerät" ein Problem mit der Farbdarstellung hat. Beim Abspeichern kannst du aber beliebige Farben speichern. Warum dann den Umweg über Dithering gehen. (Das macht dann auch niemand, wenn es nicht für die Ausgabe auf einem entsprechenden Gerät gedacht ist.)
Deswegen der Unterschied zwischen Dateien zum drucken und Speichern.
debianoli hat geschrieben: ↑ zum Beitrag ↑
27.11.2018 18:03:29
Aber selbst da fällt die Bild-Qualität des Posters mit der Qualität des Ausgangsfotos: Was nicht ursprünglich nicht da war, ist auch durch Vergrößerung nicht da.
Eben genau das ist das was ich meine. Bei nem Scan gibt es ganz andere limitierende Faktoren als die Auflösung des Bildes.
rot: Moderator wanne spricht, default: User wanne spricht.

Antworten