(gelöst) LO und DOS-Text
(gelöst) LO und DOS-Text
openoffice (4.1.2) unter Debian erkennt beim Dateiöffnen via Dateimanager (xfe), dass es sich um DOS-Text handelt und bietet beim Öffnen den geeigneten Zeichensatz (DOS/OS2-850) an. LO 5.2.7.2 macht das nicht. Ich vermute, man kann das auch unter LO irgendwie hinkriegen. Zumindest meine ich, dass auch LO das mal konnte. Aber wie?
Eben seh' ich's: Via xfe geht's nicht, aber aus bereits gestartetem LO-Wrtier heraus geht's, wenn man bei Menü Datei/Öffnen als Dateityp "Text - Textkodireung wählen" wählt. Find' ich nicht so pralle.
Eben seh' ich's: Via xfe geht's nicht, aber aus bereits gestartetem LO-Wrtier heraus geht's, wenn man bei Menü Datei/Öffnen als Dateityp "Text - Textkodireung wählen" wählt. Find' ich nicht so pralle.
Zuletzt geändert von guennid am 10.04.2018 07:48:23, insgesamt 1-mal geändert.
Re: LO und DOS-Text
Es gibt in der Auswahl "Dateityp"
Text (*.txt)
Text - Textkodierung wählen (*.txt)
org.openoffice.TypeDetection.Filter/Filters/Text
org.openoffice.TypeDetection.Filter/Filters/Text - csv - txt
org.openoffice.TypeDetection.Filter/Filters/Text (encoded) (3Stück)
Die letzteren haben als 'UIName' "Text - Textkodierung wählen (...)".
"Text" hat kein "UIComponent" 'com.sun.star.comp.Writer.FilterOptionsDialog'
Ich habe mal die Eigenschaft 'PREFERRED' von "Text" nach "Text (encoded)" verschoben.
Dann gibt es beim Auswählen einer CP850.txt aber nur eine "Filterauswahl", jedoch öffnet das Dokument nicht mehr.
org.openoffice.TypeDetection.Types/Types/generic_Text
"PreferredFilter" '(leer)' auf 'Text (encoded)' gesetzt.
Auch mal "Preferred" 'true'/'false'.
Alles auch in Kombinationen bin ich nicht weiter gekommen, sodaß bei einer *.txt generell der Kodierungsdialog öffnet.
Aber das war auch nur Herumgestochere, ohne daß ich näheres über die Abläufe in libreoffice kenne.
Text (*.txt)
Text - Textkodierung wählen (*.txt)
org.openoffice.TypeDetection.Filter/Filters/Text
org.openoffice.TypeDetection.Filter/Filters/Text - csv - txt
org.openoffice.TypeDetection.Filter/Filters/Text (encoded) (3Stück)
Die letzteren haben als 'UIName' "Text - Textkodierung wählen (...)".
"Text" hat kein "UIComponent" 'com.sun.star.comp.Writer.FilterOptionsDialog'
Ich habe mal die Eigenschaft 'PREFERRED' von "Text" nach "Text (encoded)" verschoben.
Dann gibt es beim Auswählen einer CP850.txt aber nur eine "Filterauswahl", jedoch öffnet das Dokument nicht mehr.
org.openoffice.TypeDetection.Types/Types/generic_Text
"PreferredFilter" '(leer)' auf 'Text (encoded)' gesetzt.
Auch mal "Preferred" 'true'/'false'.
Alles auch in Kombinationen bin ich nicht weiter gekommen, sodaß bei einer *.txt generell der Kodierungsdialog öffnet.
Aber das war auch nur Herumgestochere, ohne daß ich näheres über die Abläufe in libreoffice kenne.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
Re: LO und DOS-Text
Nun ja, rendegast, so fit wie du werde ich in diesem Leben nicht mehr werden.
Ich sagte ja: über kann man den DOS-Text in LO korrekt darstellen, auf dem Weg über den Datei-Öffnen-Dialog IN LO. Nach meinem Dafürhalten eine arge Verschlimmbesserung gegenüber (noch) älteren LO-Versionen. Aber bereits das Speichern als unformatierter Linux-Text bietet schon wieder ungeahnte Schwierigkeiten angesichts der disparaten "txt"-Formate, die LO so anbietet. Das korrekte Format via trial and error rauszufinden, habe ich mir erspart.. Ich habe mir dann so geholfen, dass ich den in LO korrekt dargestellten Dateiinhalt in einen Linux-Editor gekippt und damit gespeichert habe, da blieb er dann als unformatiert lesbarer Text auch für LO via Dateimanager erhalten.
Den DOS-Text vorher mit convert umzuwandeln geht natürlich auch. Mein laienhaftes script dafür in einer dBase-Anwendung ist aber ziemlich alt und zu sehr auf einen bestimmten Dateipfad ausgelegt, so dass ich mir die Mühe, das zu verbessern, auch geschenkt habe.
Ich sagte ja: über
Code: Alles auswählen
Text - Textkodierung wählen (*.txt)
Den DOS-Text vorher mit convert umzuwandeln geht natürlich auch. Mein laienhaftes script dafür in einer dBase-Anwendung ist aber ziemlich alt und zu sehr auf einen bestimmten Dateipfad ausgelegt, so dass ich mir die Mühe, das zu verbessern, auch geschenkt habe.
Re: LO und DOS-Text
convert bietet keine schlüssigen Treffer.guennid hat geschrieben: Den DOS-Text vorher mit convert umzuwandeln
Das Programm 'convert' aus der imagemagick-Suite dient zur Bildmanipulation/-konvertierung.
Gemeint ist vielleicht eher 'iconv' aus libc-bin, zBsp.
Code: Alles auswählen
iconv --list
file dos.txt (wobei das nicht gerade auf die Ausgangskodierung schließen läßt)
iconv -f cp850 -t utf8 -o dos.txt_out.txt dos.txt
fromdos dos.txt
Testen ist aufwändig, Ausprobieren aller iconv-Codecs:
Code: Alles auswählen
for i in $(iconv --list | sed 's@//$@@'); do
cat dos.txt | iconv -f $i 2>/dev/null | grep -b "Problemstelle" 2>/dev/null
done | sort -u
Code: Alles auswählen
for i in $(iconv --list | sed 's@//$@@'); do
cat dos.txt | iconv -f $i 2>/dev/null | grep -b "Problemstelle" 2>/dev/null
echo "__ $i"
done | grep "Problemstelle_spezifizierter" -A1
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
Re: LO und DOS-Text
iconv stimmt wohl, ich habe das seit 2014 nicht mehr gemacht. Vielleicht am einfachsten: Umwandlung in Systemzeichensatz (hier utf8). Überschreibt allerdings warnungslos [Textdatei].
So funktioniert's mit iconv:
Code: Alles auswählen
recode ibm850 [Textdatei]
So funktioniert's mit iconv:
Code: Alles auswählen
iconv [Quelltext]-f IBM850 -t utf8 -o [Zieltext]
-
- Beiträge: 128
- Registriert: 05.09.2016 12:04:56
- Lizenz eigener Beiträge: MIT Lizenz
Re: LO und DOS-Text
Der Fremde ist nur in der Fremde ein Fremder (Karl Valentin).
Re: LO und DOS-Text
Code: Alles auswählen
stretch (stable) (text): Umwandlung der Zeilenenden von Textdateien zwischen CRLF und LF
-
- Beiträge: 705
- Registriert: 09.09.2014 18:33:22
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: LO und DOS-Text
Es gab einen Bug wo LO, wenn EOL-Encoding einer zu öffnenden Textdatei und des aktuellen Systems auf dem LO läuft nicht gleich waren (also CR vs. CRLF), der Text u.U. nicht korrekt identifiziert wurde. Das wurde m.W. mit LO 5.4 bereinigt, finde den Bug gerade nicht im Tracker.
Da ging es zwar um UTF-Varianten, aber zumindest die Ausgangslage wäre ja in deinem Beispiel die selbe: DOS nutzt CRLF, Debian nur LF. Dass sie die fehlende Abfrage bewusst entfernt haben, kann ich mir nicht vorstellen.
Wieso musst du DOS-Texte laden und speichern? Und wenn du das regelmäßig musst, ist vielleicht ein Texteditor die bessere Wahl?
Da ging es zwar um UTF-Varianten, aber zumindest die Ausgangslage wäre ja in deinem Beispiel die selbe: DOS nutzt CRLF, Debian nur LF. Dass sie die fehlende Abfrage bewusst entfernt haben, kann ich mir nicht vorstellen.
Wieso musst du DOS-Texte laden und speichern? Und wenn du das regelmäßig musst, ist vielleicht ein Texteditor die bessere Wahl?
Re: LO und DOS-Text
Würde ich ja nehmen, aber die machen den Job nicht, jedenfalls nicht so was Popeliges wie leafpad. Mit geany würd's wohl gehen, aber das finde ich dafür umständlich und vim wird's wohl allemal können - aber ich kann kein vim. LO war und OO ist da ganz praktisch. - Und nochmal: es geht mir weniger um die Zeilenenden, wichtiger sind die deutschen Sonderzeichen. Aber da ich ja nun dank der Verwechslung mit convert die passenden Kommandos für recode und iconv wieder hervorgekramt habe, komme ich auch damit zurecht.korodny hat geschrieben: ist vielleicht ein Texteditor die bessere Wahl?
-
- Beiträge: 705
- Registriert: 09.09.2014 18:33:22
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: LO und DOS-Text
Du hast mich falsch verstanden: Meine Theorie war, dass LO aufgrund eines Bugs wegen der unterschiedlichen Zeilenenden durcheinander gerät und dir deswegen die Auswahl der passenden Codepage nicht mehr anbietet. Dieser Bug müsste in neueren LO-Versionen beseitigt sein.guennid hat geschrieben:09.04.2018 20:23:13Und nochmal: es geht mir weniger um die Zeilenenden, wichtiger sind die deutschen Sonderzeichen.
Texteditor zum bearbeiten des Texts, nicht zum Ändern der Kodierung.Würde ich ja nehmen, aber die machen den Job nicht, jedenfalls nicht so was Popeliges wie leafpad. Mit geany würd's wohl gehen, aber das finde ich dafür umständlich
Wieso musst du DOS-Texte speichern? Das verstehe ich immer noch nicht. Wenn's nur ums Laden geht, könnte man den vorhandenen Satz an Texten ja einmalig per Bash-Schleife nach UTF8 o.ä. konvertieren.
Re: (gelöst) LO und DOS-Text
Ich muss nicht, ich will.Korodny hat geschrieben:Wieso musst du DOS-Texte speichern?
Ich denke nicht. Ich habe nur dein neuerliches Aufgreifen der Zeilenenden selbst aufgegriffen. Ob der genannte Bug DOS-Texte betrifft ist unklar, die Diskussion deswegen ziemlich theoretisch. Und ich werde deswegen keine neuere LO-Version am Paketmanager vorbei installieren: Kommt Zeit kommt Rat. Im Übrigen kann man ja, wie o.a. auch mit LO 5.2.7.2 DOS-Text konvertieren (und speichern ) - auf eine von mir als recht kryptisch empfundene Weise.Korodny hat geschrieben:Du hast mich falsch verstanden: