(gelöst) LO und DOS-Text

Du hast Probleme mit Deinem eMail-Programm, Webbrowser oder Textprogramm? Dein Lieblingsprogramm streikt?
Antworten
guennid

(gelöst) LO und DOS-Text

Beitrag von guennid » 30.03.2018 10:09:02

openoffice (4.1.2) unter Debian erkennt beim Dateiöffnen via Dateimanager (Debianxfe), dass es sich um DOS-Text handelt und bietet beim Öffnen den geeigneten Zeichensatz (DOS/OS2-850) an. LO 5.2.7.2 macht das nicht. Ich vermute, man kann das auch unter LO irgendwie hinkriegen. Zumindest meine ich, dass auch LO das mal konnte. Aber wie?

Eben seh' ich's: Via xfe geht's nicht, aber aus bereits gestartetem LO-Wrtier heraus geht's, wenn man bei Menü Datei/Öffnen als Dateityp "Text - Textkodireung wählen" wählt. Find' ich nicht so pralle.
Zuletzt geändert von guennid am 10.04.2018 07:48:23, insgesamt 1-mal geändert.

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: LO und DOS-Text

Beitrag von rendegast » 08.04.2018 11:20:44

Es gibt in der Auswahl "Dateityp"
Text (*.txt)
Text - Textkodierung wählen (*.txt)

org.openoffice.TypeDetection.Filter/Filters/Text
org.openoffice.TypeDetection.Filter/Filters/Text - csv - txt
org.openoffice.TypeDetection.Filter/Filters/Text (encoded) (3Stück)
Die letzteren haben als 'UIName' "Text - Textkodierung wählen (...)".

"Text" hat kein "UIComponent" 'com.sun.star.comp.Writer.FilterOptionsDialog'

Ich habe mal die Eigenschaft 'PREFERRED' von "Text" nach "Text (encoded)" verschoben.
Dann gibt es beim Auswählen einer CP850.txt aber nur eine "Filterauswahl", jedoch öffnet das Dokument nicht mehr.


org.openoffice.TypeDetection.Types/Types/generic_Text
"PreferredFilter" '(leer)' auf 'Text (encoded)' gesetzt.
Auch mal "Preferred" 'true'/'false'.


Alles auch in Kombinationen bin ich nicht weiter gekommen, sodaß bei einer *.txt generell der Kodierungsdialog öffnet.
Aber das war auch nur Herumgestochere, ohne daß ich näheres über die Abläufe in libreoffice kenne.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

guennid

Re: LO und DOS-Text

Beitrag von guennid » 08.04.2018 11:42:07

Nun ja, rendegast, so fit wie du werde ich in diesem Leben nicht mehr werden. :wink:

Ich sagte ja: über

Code: Alles auswählen

Text - Textkodierung wählen (*.txt)
kann man den DOS-Text in LO korrekt darstellen, auf dem Weg über den Datei-Öffnen-Dialog IN LO. Nach meinem Dafürhalten eine arge Verschlimmbesserung gegenüber (noch) älteren LO-Versionen. Aber bereits das Speichern als unformatierter Linux-Text bietet schon wieder ungeahnte Schwierigkeiten angesichts der disparaten "txt"-Formate, die LO so anbietet. Das korrekte Format via trial and error rauszufinden, habe ich mir erspart.. Ich habe mir dann so geholfen, dass ich den in LO korrekt dargestellten Dateiinhalt in einen Linux-Editor gekippt und damit gespeichert habe, da blieb er dann als unformatiert lesbarer Text auch für LO via Dateimanager erhalten. :wink:

Den DOS-Text vorher mit Debianconvert umzuwandeln geht natürlich auch. Mein laienhaftes script dafür in einer dBase-Anwendung ist aber ziemlich alt und zu sehr auf einen bestimmten Dateipfad ausgelegt, so dass ich mir die Mühe, das zu verbessern, auch geschenkt habe. :wink:

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: LO und DOS-Text

Beitrag von rendegast » 08.04.2018 14:29:03

guennid hat geschrieben: Den DOS-Text vorher mit Debianconvert umzuwandeln
Debianconvert bietet keine schlüssigen Treffer.
Das Programm 'convert' aus der imagemagick-Suite dient zur Bildmanipulation/-konvertierung.
Gemeint ist vielleicht eher 'iconv' aus Debianlibc-bin, zBsp.

Code: Alles auswählen

iconv --list

file dos.txt            (wobei das nicht gerade auf die Ausgangskodierung schließen läßt)
iconv -f cp850 -t utf8  -o dos.txt_out.txt  dos.txt
fromdos dos.txt




Testen ist aufwändig, Ausprobieren aller iconv-Codecs:

Code: Alles auswählen

for i in $(iconv --list | sed 's@//$@@'); do
    cat dos.txt | iconv -f $i 2>/dev/null  |  grep -b "Problemstelle" 2>/dev/null
done | sort -u
Falls Treffer dann weiterforschen

Code: Alles auswählen

for i in $(iconv --list | sed 's@//$@@'); do
    cat dos.txt | iconv -f $i 2>/dev/null  |  grep -b "Problemstelle" 2>/dev/null
    echo "__ $i"
done      |  grep "Problemstelle_spezifizierter" -A1
gibt eine Liste passender Codecs (zumindest für "Problemstelle").
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

guennid

Re: LO und DOS-Text

Beitrag von guennid » 08.04.2018 16:54:50

iconv stimmt wohl, ich habe das seit 2014 nicht mehr gemacht. Vielleicht am einfachsten:

Code: Alles auswählen

recode ibm850 [Textdatei]
Umwandlung in Systemzeichensatz (hier utf8). Überschreibt allerdings warnungslos [Textdatei].

So funktioniert's mit iconv:

Code: Alles auswählen

iconv [Quelltext]-f IBM850 -t utf8 -o [Zieltext]

2undvierzig
Beiträge: 128
Registriert: 05.09.2016 12:04:56
Lizenz eigener Beiträge: MIT Lizenz

Re: LO und DOS-Text

Beitrag von 2undvierzig » 08.04.2018 17:38:20

Der Fremde ist nur in der Fremde ein Fremder (Karl Valentin).

guennid

Re: LO und DOS-Text

Beitrag von guennid » 08.04.2018 17:45:23

Code: Alles auswählen

stretch (stable) (text): Umwandlung der Zeilenenden von Textdateien zwischen CRLF und LF
https://packages.debian.org/search?sear ... s=dos2unix

Korodny
Beiträge: 704
Registriert: 09.09.2014 18:33:22
Lizenz eigener Beiträge: GNU Free Documentation License

Re: LO und DOS-Text

Beitrag von Korodny » 09.04.2018 19:35:08

Es gab einen Bug wo LO, wenn EOL-Encoding einer zu öffnenden Textdatei und des aktuellen Systems auf dem LO läuft nicht gleich waren (also CR vs. CRLF), der Text u.U. nicht korrekt identifiziert wurde. Das wurde m.W. mit LO 5.4 bereinigt, finde den Bug gerade nicht im Tracker.

Da ging es zwar um UTF-Varianten, aber zumindest die Ausgangslage wäre ja in deinem Beispiel die selbe: DOS nutzt CRLF, Debian nur LF. Dass sie die fehlende Abfrage bewusst entfernt haben, kann ich mir nicht vorstellen.

Wieso musst du DOS-Texte laden und speichern? Und wenn du das regelmäßig musst, ist vielleicht ein Texteditor die bessere Wahl?

guennid

Re: LO und DOS-Text

Beitrag von guennid » 09.04.2018 20:23:13

korodny hat geschrieben: ist vielleicht ein Texteditor die bessere Wahl?
Würde ich ja nehmen, aber die machen den Job nicht, jedenfalls nicht so was Popeliges wie leafpad. Mit geany würd's wohl gehen, aber das finde ich dafür umständlich und vim wird's wohl allemal können - aber ich kann kein vim. :wink: LO war und OO ist da ganz praktisch. - Und nochmal: es geht mir weniger um die Zeilenenden, wichtiger sind die deutschen Sonderzeichen. Aber da ich ja nun dank der Verwechslung mit convert die passenden Kommandos für recode und iconv wieder hervorgekramt habe, komme ich auch damit zurecht.

Korodny
Beiträge: 704
Registriert: 09.09.2014 18:33:22
Lizenz eigener Beiträge: GNU Free Documentation License

Re: LO und DOS-Text

Beitrag von Korodny » 09.04.2018 23:09:45

guennid hat geschrieben: ↑ zum Beitrag ↑
09.04.2018 20:23:13
Und nochmal: es geht mir weniger um die Zeilenenden, wichtiger sind die deutschen Sonderzeichen.
Du hast mich falsch verstanden: Meine Theorie war, dass LO aufgrund eines Bugs wegen der unterschiedlichen Zeilenenden durcheinander gerät und dir deswegen die Auswahl der passenden Codepage nicht mehr anbietet. Dieser Bug müsste in neueren LO-Versionen beseitigt sein.
Würde ich ja nehmen, aber die machen den Job nicht, jedenfalls nicht so was Popeliges wie leafpad. Mit geany würd's wohl gehen, aber das finde ich dafür umständlich
Texteditor zum bearbeiten des Texts, nicht zum Ändern der Kodierung.

Wieso musst du DOS-Texte speichern? Das verstehe ich immer noch nicht. Wenn's nur ums Laden geht, könnte man den vorhandenen Satz an Texten ja einmalig per Bash-Schleife nach UTF8 o.ä. konvertieren.

guennid

Re: (gelöst) LO und DOS-Text

Beitrag von guennid » 10.04.2018 07:57:47

Korodny hat geschrieben:Wieso musst du DOS-Texte speichern?
Ich muss nicht, ich will.
Korodny hat geschrieben:Du hast mich falsch verstanden:
Ich denke nicht. Ich habe nur dein neuerliches Aufgreifen der Zeilenenden selbst aufgegriffen. Ob der genannte Bug DOS-Texte betrifft ist unklar, die Diskussion deswegen ziemlich theoretisch. Und ich werde deswegen keine neuere LO-Version am Paketmanager vorbei installieren: Kommt Zeit kommt Rat. Im Übrigen kann man ja, wie o.a. auch mit LO 5.2.7.2 DOS-Text konvertieren (und speichern :wink: ) - auf eine von mir als recht kryptisch empfundene Weise.

Antworten