PDF auf Rechtschreibung prüfen
- matman
- Beiträge: 744
- Registriert: 03.07.2008 10:50:07
- Lizenz eigener Beiträge: GNU Free Documentation License
- Wohnort: Hamburg
-
Kontaktdaten:
PDF auf Rechtschreibung prüfen
Hallo, ich will gerne ein PDF auf Rechtschreibung prüfen. Da ich mich eh noch nie mit Rechtschreibprüfung beschäftigt habe bin ich da recht ahnungslos. Mit Google habe ich zu diesem Vorhaben diverse Artikel über Texmaker gefunden, in denen steht, das es damit gehen soll. Aber nirgends eine Anleitung, wie das gehen soll.
Ich habe mittlerweile diverse Spellchecker samt Dictionaries installiert, habe aber leider keinen Erfolg gehabt. Ich kann also ein PDF mit Texmaker öffnen. Und man könnte dann Seite für Seite die Rechtschreibung prüfen. Das erscheint mir allerdings sehr umständlich. Schöner wäre eine Funktion, mit der man das gesamte PDF prüfen könnte und alle vermeintlichen Fehler unterstrichen angezeigt bekommt. Mit Texmaker geht aber, wie es aussieht, immer nur eine Seite zur Zeit. Und ausserdem passiert rein gar nichts, wenn man auf Prüfung starten klickt. Nicht einmal in der Konsole gibt es eine Meldung darüber, was da los sein könnte.
Texmaker scheint mir für meinen Zweck allerdings eher etwas ungeeignet, wenn die Bedienung so kompliziert ist. Gibt es vielleicht auch Alternetiven? Irgend ein Prog das z.B. den Text aus dem PDF ausliest, dabei auf Rechtschreibung prüft und dann alles mit unterstrichenen Fehlern in eine Textdatei schreibt? Wenn das mit einem einfachen Konsolenkommando machbar wäre, dann wäre ich damit schon sehr glücklich, denke ich. Die Korrekturen werden dann nämlich an der Quelldatei vorgenommen, welche danach in ein PDF umgewandelt wird.
Ich habe mittlerweile diverse Spellchecker samt Dictionaries installiert, habe aber leider keinen Erfolg gehabt. Ich kann also ein PDF mit Texmaker öffnen. Und man könnte dann Seite für Seite die Rechtschreibung prüfen. Das erscheint mir allerdings sehr umständlich. Schöner wäre eine Funktion, mit der man das gesamte PDF prüfen könnte und alle vermeintlichen Fehler unterstrichen angezeigt bekommt. Mit Texmaker geht aber, wie es aussieht, immer nur eine Seite zur Zeit. Und ausserdem passiert rein gar nichts, wenn man auf Prüfung starten klickt. Nicht einmal in der Konsole gibt es eine Meldung darüber, was da los sein könnte.
Texmaker scheint mir für meinen Zweck allerdings eher etwas ungeeignet, wenn die Bedienung so kompliziert ist. Gibt es vielleicht auch Alternetiven? Irgend ein Prog das z.B. den Text aus dem PDF ausliest, dabei auf Rechtschreibung prüft und dann alles mit unterstrichenen Fehlern in eine Textdatei schreibt? Wenn das mit einem einfachen Konsolenkommando machbar wäre, dann wäre ich damit schon sehr glücklich, denke ich. Die Korrekturen werden dann nämlich an der Quelldatei vorgenommen, welche danach in ein PDF umgewandelt wird.
System: Bullseye
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525
Re: PDF auf Rechtschreibung prüfen
Mir ist der Sinn des Vorhabens nicht recht klar. Warum soll das Endprodukt (pdf) auf Rechtschreibfehler geprüft werden, wenn man das doch in der zugrundeligenden Textverarbeitung tun können sollte?
Grüße, Günther
Grüße, Günther
Re: PDF auf Rechtschreibung prüfen
Du kannst doch PDFs in Libre Office Draw öffnen und dann die Rechtschreibung (F7) drüber laufen lassen.
Re: PDF auf Rechtschreibung prüfen
pdf2txt macht dir text aus PDFs. Da kannst du dann eine Rechtschreibprüfung deiner Wahl drüber laufen lassen.
Also mit langtool (Gute Rechtschreibprüfung. Leider nicht in den Quellen):
hunspell (In den Quellen. Ich glaueb OOo nimmt die auch)
oder aspell (standardrechtschreibprüfung unter Debian kann HTML und kann deswegen mit dem output von pdftohtml umgehen, der glaube ich besser ist als der von pdf2txt ist.)
Also mit langtool (Gute Rechtschreibprüfung. Leider nicht in den Quellen):
Code: Alles auswählen
pdftotext pdf.pdf - | langtool -c utf-8 -l de-DE --disable WHITESPACE_RULE
Code: Alles auswählen
pdftotext pdf.pdf /tmp/pdf.txt
hunspell -i utf-8 -d de_DE /tmp/pdf.txt
Code: Alles auswählen
pdftohtml pdf.pdf > /tmp/
aspell -H -l de -c /tmp/s.html
rot: Moderator wanne spricht, default: User wanne spricht.
- matman
- Beiträge: 744
- Registriert: 03.07.2008 10:50:07
- Lizenz eigener Beiträge: GNU Free Documentation License
- Wohnort: Hamburg
-
Kontaktdaten:
Re: PDF auf Rechtschreibung prüfen
Wer hat gesagt, das man das dort tun können sollte? Die Quelldatei enthält viele LaTex Befehle, die man vermutlich dem spell checker erst einmal beibringen muss. Und ich suche halt eine möglichst einfache Lösung.guennid hat geschrieben:wenn man das doch in der zugrundeligenden Textverarbeitung tun können sollte?
Das werde ich doch glatt mal ausprobieren. Und ansonsten hat "wanne" ja noch ein paar interessante Möglichkeiten vorgeschlagen. Danke mal soweithugediggs hat geschrieben:Libre Office Draw
Eine allgemeine Frage hätte ich gerade noch: die "100% korrekte" Rechtschreibprüfung gibt es ja glaube ich eh nicht. Aber gibt es irgendwo Qualitätstests, die etwas über die Trefferquote von Fehlern aussagen? Ich habe letztens in einem Forum gelesen, das die Rechtschreibsoftware vom Duden die effektivste sein soll. Aber ich schätze, die gibt es wohl nur für Windows. Wie sieht es da mit Open Source aus? Gibt es da auch sehr gute spell checker bzw. entsprechende Testergebnisse?
System: Bullseye
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525
Re: PDF auf Rechtschreibung prüfen
Nein. Indem Fall is die einfachst mögliche Lösung aspell. Das kann schon latex. ( Mit der Option -t)matman hat geschrieben:Die Quelldatei enthält viele LaTex Befehle, die man vermutlich dem spell checker erst einmal beibringen muss. Und ich suche halt eine möglichst einfache Lösung.
Wesentlich einfacher im allgemeinen ist PDF immer entstation es lässt sich relativ einfach erstellen aber danach absolut nichtmehr weiterverarbeiten. Es ist am ehesten mit einem Bildvormat verglcihebar.
Starke Empfehlung: Niemals PDFs erstellen wenn du damit noch etwas anderes machen willst als ausdrucken in genau dem Papierformat.
rot: Moderator wanne spricht, default: User wanne spricht.
Re: PDF auf Rechtschreibung prüfen
Im adobe reader gibt es plug_ins/Spelling.api.
Ich verschiebe das zwar immer nach optional/, aber das klingt nach der gewünschten Funktion.
Ich verschiebe das zwar immer nach optional/, aber das klingt nach der gewünschten Funktion.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
- matman
- Beiträge: 744
- Registriert: 03.07.2008 10:50:07
- Lizenz eigener Beiträge: GNU Free Documentation License
- Wohnort: Hamburg
-
Kontaktdaten:
Re: PDF auf Rechtschreibung prüfen
Stimmt . Alledings: ob mit oder ohne -t macht bei mir (Wheezy) keinen Unterschied. In der Manpage steht auch nichts von -t. Möglicherweise nicht mehr enthalten weil eh schon Standard?wanne hat geschrieben:aspell. ( Mit der Option -t)
Darum behalte ich ja in jedem Fall die .tex Datei. So kann man jederzeit noch Änderungen machen.wanne hat geschrieben:Niemals PDFs erstellen wenn du damit noch etwas anderes machen willst.
Ach ja, den Adobe Reader.... den muss ich auch mal wieder installieren, wenn ich sehen will ob mein PDF auch auf nem Win-PC gut aussieht.rendegast hat geschrieben:Im adobe reader gibt es plug_ins/Spelling.api.
System: Bullseye
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525