PDF-Datei mit nicht-eingebetteten Schriften

Du hast Probleme mit Deinem eMail-Programm, Webbrowser oder Textprogramm? Dein Lieblingsprogramm streikt?
Antworten
LinuxFanKR13
Beiträge: 78
Registriert: 19.04.2020 10:01:02

Re: PDF-Datei mit nicht-eingebetteten Schriften

Beitrag von LinuxFanKR13 » 10.10.2021 17:23:33

Hallo Community,

ich möchte folgenden Zwischenstand mitteilen:

1. Dass eine PDF-Datei im PDF/A-Format eingebettete Schriften enthält, habe ich ja bereits in meinem ersten Beitrag geschrieben. Ein anderes Format ist aus meiner Sicht auch gar nicht sinnvoll, weil ich beim Erzeugen der PDF-Datei ja nie sagen kann, auf welchem System diese Datei mal wieder geöffnet wird. Allerdings musste ich selbst bei LibreOffice auf meinem System den Haken erst setzen, dass dieses Format zum Einsatz kommt. Wenn eine Vielzahl an Behörden, Banken, Versicherungen usw. dieses Format bereits nutzen, ist das sehr lobenswert. Derzeit ist das aber noch nicht überall der Fall und als einzelner kann man zwar bei den genannten Institutionen auf den Mangel hinweisen, bewegen wird man in der Regel nichts. Den Teil können wir damit abschließen :D.

2. Zur weiteren Suche habe ich nun die PDF-Datei mit den beiden Schriften Arial+000040 und Arial,Bold+000041
verwendet.

Code: Alles auswählen

$ fc-match 'Arial+000040'
Vera.ttf: "Bitstream Vera Sans" "Roman"

$ fc-match 'Arial,Bold+000041'
Arial.ttf: "Arial" "Standard"
Ich zeige die PDF-Dateien mit folgenden Programmen an:
  • atril
  • evince
  • firefox-esr
  • google-chromium
  • Adobe Acrobat Reader DC (2021.001.20145) unter macOS Catalina 10.15.7 in einer QEMU-virtuellen Maschine als „Referenz“
Die jeweiligen Linux-Programmversionen kommen aus Debian 11.1 bullseye; ich verwende nur die stable-Version inkl. Sicherheitsupdates, bisher keine backports-Pakete

Bei Atril und Evince wird die PDF-Datei nicht korrekt angezeigt, der Abstand zwischen den Großbuchstaben am Wortanfang und den nächsten Buchstaben ist zu groß.
Evince zeigt im Vergleich zu Atril jedoch genauer an, welche Schriften tatsächlich geladen werden, nämlich Bitsteam Vera Sans Bold (/usr/share/fonts/truetype/ttf-bitstream-vera/VeraBd.ttf) und Arial Negreta (/usr/share/fonts/truetype/msttcorefonts/Arial_Bold.ttf).
Firefox-esr zeigt die Datei „korrekter" an, mit strace habe ich herausgefunden, dass wohl nicht nur Vera.ttf, sondern auch VeraMono.ttf geladen wird, allerdings habe ich keinen Eintrag für Arial gefunden. Wenn man sehr stark vergrößert, habe ich den Eindruck, dass man erkennt, dass die Großbuchstaben aus einem anderen Zeichensatz sind. Google Chromium ist identisch zu Firefox-esr.
Beim Acrobat Reader unter macOS wird angezeigt, dass für Arial+000040 die Schrift Adobe Sans MM und für Arial,Bold+000041 die Schrift Arial,Bold+000041 verwendet wird.

Das Problem liegt also wohl an den Anzeigeprogrammen Atril und Evince, die die Maße der einzelnen Zeichen anders behandeln als Firefox-esr und Google Chromium.

Abhilfe ist also zunächst mal die Nutzung von Firefox-esr für das Anzeigen von PDFs mit nicht-eingebetteten Schriften. Eine nicht ganz befriedigende Lösung, aber immerhin eine Lösung :).

Viele Grüße

Antworten