PDF auf Rechtschreibung prüfen

Du hast Probleme mit Deinem eMail-Programm, Webbrowser oder Textprogramm? Dein Lieblingsprogramm streikt?
Antworten
Benutzeravatar
matman
Beiträge: 723
Registriert: 03.07.2008 10:50:07
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Hamburg
Kontaktdaten:

PDF auf Rechtschreibung prüfen

Beitrag von matman » 26.06.2014 17:03:53

Hallo, ich will gerne ein PDF auf Rechtschreibung prüfen. Da ich mich eh noch nie mit Rechtschreibprüfung beschäftigt habe bin ich da recht ahnungslos. Mit Google habe ich zu diesem Vorhaben diverse Artikel über Texmaker gefunden, in denen steht, das es damit gehen soll. Aber nirgends eine Anleitung, wie das gehen soll.

Ich habe mittlerweile diverse Spellchecker samt Dictionaries installiert, habe aber leider keinen Erfolg gehabt. Ich kann also ein PDF mit Texmaker öffnen. Und man könnte dann Seite für Seite die Rechtschreibung prüfen. Das erscheint mir allerdings sehr umständlich. Schöner wäre eine Funktion, mit der man das gesamte PDF prüfen könnte und alle vermeintlichen Fehler unterstrichen angezeigt bekommt. Mit Texmaker geht aber, wie es aussieht, immer nur eine Seite zur Zeit. Und ausserdem passiert rein gar nichts, wenn man auf Prüfung starten klickt. Nicht einmal in der Konsole gibt es eine Meldung darüber, was da los sein könnte.

Texmaker scheint mir für meinen Zweck allerdings eher etwas ungeeignet, wenn die Bedienung so kompliziert ist. Gibt es vielleicht auch Alternetiven? Irgend ein Prog das z.B. den Text aus dem PDF ausliest, dabei auf Rechtschreibung prüft und dann alles mit unterstrichenen Fehlern in eine Textdatei schreibt? Wenn das mit einem einfachen Konsolenkommando machbar wäre, dann wäre ich damit schon sehr glücklich, denke ich. Die Korrekturen werden dann nämlich an der Quelldatei vorgenommen, welche danach in ein PDF umgewandelt wird.
System: Buster/Jessie (Dualboot) / KVM VMs: Stretch, Jessie, WinXP, Win7
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525

guennid

Re: PDF auf Rechtschreibung prüfen

Beitrag von guennid » 26.06.2014 17:32:17

Mir ist der Sinn des Vorhabens nicht recht klar. Warum soll das Endprodukt (pdf) auf Rechtschreibfehler geprüft werden, wenn man das doch in der zugrundeligenden Textverarbeitung tun können sollte?

Grüße, Günther

hugediggs
Beiträge: 171
Registriert: 26.07.2012 22:40:23

Re: PDF auf Rechtschreibung prüfen

Beitrag von hugediggs » 26.06.2014 18:41:48

Du kannst doch PDFs in Libre Office Draw öffnen und dann die Rechtschreibung (F7) drüber laufen lassen.

wanne
Moderator
Beiträge: 6982
Registriert: 24.05.2010 12:39:42

Re: PDF auf Rechtschreibung prüfen

Beitrag von wanne » 26.06.2014 20:55:17

pdf2txt macht dir text aus PDFs. Da kannst du dann eine Rechtschreibprüfung deiner Wahl drüber laufen lassen.
Also mit langtool (Gute Rechtschreibprüfung. Leider nicht in den Quellen):

Code: Alles auswählen

pdftotext pdf.pdf - | langtool -c utf-8 -l de-DE --disable WHITESPACE_RULE
hunspell (In den Quellen. Ich glaueb OOo nimmt die auch)

Code: Alles auswählen

pdftotext pdf.pdf  /tmp/pdf.txt
hunspell -i utf-8 -d de_DE /tmp/pdf.txt
oder aspell (standardrechtschreibprüfung unter Debian kann HTML und kann deswegen mit dem output von pdftohtml umgehen, der glaube ich besser ist als der von pdf2txt ist.)

Code: Alles auswählen

pdftohtml pdf.pdf > /tmp/
aspell -H -l de -c /tmp/s.html
rot: Moderator wanne spricht, default: User wanne spricht.

Benutzeravatar
matman
Beiträge: 723
Registriert: 03.07.2008 10:50:07
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Hamburg
Kontaktdaten:

Re: PDF auf Rechtschreibung prüfen

Beitrag von matman » 27.06.2014 18:03:40

guennid hat geschrieben:wenn man das doch in der zugrundeligenden Textverarbeitung tun können sollte?
Wer hat gesagt, das man das dort tun können sollte? Die Quelldatei enthält viele LaTex Befehle, die man vermutlich dem spell checker erst einmal beibringen muss. Und ich suche halt eine möglichst einfache Lösung.
hugediggs hat geschrieben:Libre Office Draw
Das werde ich doch glatt mal ausprobieren. Und ansonsten hat "wanne" ja noch ein paar interessante Möglichkeiten vorgeschlagen. Danke mal soweit :D

Eine allgemeine Frage hätte ich gerade noch: die "100% korrekte" Rechtschreibprüfung gibt es ja glaube ich eh nicht. Aber gibt es irgendwo Qualitätstests, die etwas über die Trefferquote von Fehlern aussagen? Ich habe letztens in einem Forum gelesen, das die Rechtschreibsoftware vom Duden die effektivste sein soll. Aber ich schätze, die gibt es wohl nur für Windows. Wie sieht es da mit Open Source aus? Gibt es da auch sehr gute spell checker bzw. entsprechende Testergebnisse?
System: Buster/Jessie (Dualboot) / KVM VMs: Stretch, Jessie, WinXP, Win7
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525

wanne
Moderator
Beiträge: 6982
Registriert: 24.05.2010 12:39:42

Re: PDF auf Rechtschreibung prüfen

Beitrag von wanne » 27.06.2014 19:01:54

matman hat geschrieben:Die Quelldatei enthält viele LaTex Befehle, die man vermutlich dem spell checker erst einmal beibringen muss. Und ich suche halt eine möglichst einfache Lösung.
Nein. Indem Fall is die einfachst mögliche Lösung aspell. Das kann schon latex. ( Mit der Option -t)

Wesentlich einfacher im allgemeinen ist PDF immer entstation es lässt sich relativ einfach erstellen aber danach absolut nichtmehr weiterverarbeiten. Es ist am ehesten mit einem Bildvormat verglcihebar.
Starke Empfehlung: Niemals PDFs erstellen wenn du damit noch etwas anderes machen willst als ausdrucken in genau dem Papierformat.
rot: Moderator wanne spricht, default: User wanne spricht.

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: PDF auf Rechtschreibung prüfen

Beitrag von rendegast » 28.06.2014 08:47:55

Im adobe reader gibt es plug_ins/Spelling.api.
Ich verschiebe das zwar immer nach optional/, aber das klingt nach der gewünschten Funktion.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

Benutzeravatar
matman
Beiträge: 723
Registriert: 03.07.2008 10:50:07
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Hamburg
Kontaktdaten:

Re: PDF auf Rechtschreibung prüfen

Beitrag von matman » 29.06.2014 13:04:51

wanne hat geschrieben:aspell. ( Mit der Option -t)
Stimmt :D. Alledings: ob mit oder ohne -t macht bei mir (Wheezy) keinen Unterschied. In der Manpage steht auch nichts von -t. Möglicherweise nicht mehr enthalten weil eh schon Standard?
wanne hat geschrieben:Niemals PDFs erstellen wenn du damit noch etwas anderes machen willst.
Darum behalte ich ja in jedem Fall die .tex Datei. So kann man jederzeit noch Änderungen machen.
rendegast hat geschrieben:Im adobe reader gibt es plug_ins/Spelling.api.
Ach ja, den Adobe Reader.... den muss ich auch mal wieder installieren, wenn ich sehen will ob mein PDF auch auf nem Win-PC gut aussieht.
System: Buster/Jessie (Dualboot) / KVM VMs: Stretch, Jessie, WinXP, Win7
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525

Antworten