Apertium - Programm zum maschinellen Übersetzen von Texten.

Du hast Probleme mit Deinem eMail-Programm, Webbrowser oder Textprogramm? Dein Lieblingsprogramm streikt?
Antworten
katzenfan
Beiträge: 579
Registriert: 19.04.2008 22:59:51

Apertium - Programm zum maschinellen Übersetzen von Texten.

Beitrag von katzenfan » 25.02.2024 18:11:29

'N Abend,

kennt jemand dieses Program aus eigener Erfahrung?

Das Programm läßt sich aus den Debian-Softwarequellen installieren, ist aber bezüglich der Sprachpakete leider nicht aktuell.

Das Programm kommt ohne graphische Oberfläche daher, ist insofern nur via Konsole aufrufbar.

Seitens des Entwicklers gibt es inzwischen Sprachpakete, also Wörterbücher, mit deren Hilfe man Texte vom Englischen ins Deutsche offline übersetzen kann.

Dieses neue Sprachpaket nennt apt "apertium-eng-deu"; aber

Code: Alles auswählen

root@linux:/home/***# apt install /home/***/***/apertium-eng-deu_0.2.0+g273~5d7ffb79-1~sid1_all.deb
Warten auf Sperre für Zwischenspeicher: Sperre /var/lib/dpkg/lock-frontend konnte nicht erlangt werden. Sie wird von Prozess 39565 (synaptic) gehalten.       
Paketlisten werden gelesen… Fertig                                                                                                                    
Abhängigkeitsbaum wird aufgebaut… Fertig
Statusinformationen werden eingelesen… Fertig
Hinweis: »apertium-eng-deu« wird an Stelle von »/home/***/***/apertium-eng-deu_0.2.0+g273~5d7ffb79-1~sid1_all.deb« gewählt.
Einige Pakete konnten nicht installiert werden. Das kann bedeuten, dass
Sie eine unmögliche Situation angefordert haben oder, wenn Sie die
Unstable-Distribution verwenden, dass einige erforderliche Pakete noch
nicht erstellt wurden oder Incoming noch nicht verlassen haben.
Die folgenden Informationen helfen Ihnen vielleicht, die Situation zu lösen:

Die folgenden Pakete haben unerfüllte Abhängigkeiten:
 apertium-eng-deu : Hängt ab von: apertium (>= 3.8.3) aber 3.7.1-1 soll installiert werden
                    Hängt ab von: apertium-lex-tools (>= 0.4.2) aber 0.2.7-1 soll installiert werden
                    Hängt ab von: cg3 (>= 1.3.9) aber 1.3.2-1 soll installiert werden
E: Probleme können nicht korrigiert werden, Sie haben zurückgehaltene defekte Pakete.
root@linux:/home/***# 
Die Apertium-eigene Softwarequelle mit den neuen Versionen, also auch der neuen Hauptversion, siehe

http://apertium.projectjj.com/apt/relea ... /apertium/

nimmt Debian wegen nachstehender Fehlermeldung nicht an,
GPG-Fehler: http://apertium.projectjj.com/apt/nightly bullseye InRelease: Die folgenden Signaturen konnten nicht überprüft werden, weil ihr öffentlicher Schlüssel nicht verfügbar ist: NO_PUBKEY D7727BC7588E9340Das Depot »http://apertium.projectjj.com/apt/nightly bullseye InRelease« ist nicht signiert. Eine Aktualisierung von solch einem Depot kann nicht auf eine sichere Art durchgeführt werden, daher ist es standardmäßig deaktiviert. Weitere Details zur Erzeugung von Paketdepots sowie zu deren Benutzerkonfiguration finden Sie in der Handbuchseite apt-secure(8).
GPG-Fehler: http://apertium.projectjj.com/apt/release bullseye InRelease: Die folgenden Signaturen konnten nicht überprüft werden, weil ihr öffentlicher Schlüssel nicht verfügbar ist: NO_PUBKEY D7727BC7588E9340 Das Depot »http://apertium.projectjj.com/apt/release bullseye InRelease« ist nicht signiert.
Dieses "apertium-eng-deu" ist im "Nightly" von Apertium enthalten.

In den Softwarequellen von Debian ist dieses Sprachpaket, soweit ersichtlich, nicht enthalten, auch nicht bei "Sid".

Wie weiter?

mfg
katzenfan
Zuletzt geändert von katzenfan am 25.02.2024 18:24:22, insgesamt 1-mal geändert.

Benutzeravatar
KBDCALLS
Moderator
Beiträge: 22359
Registriert: 24.12.2003 21:26:55
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Re: Apertium - Programm zum maschinellen Übersetzen von Texten.

Beitrag von KBDCALLS » 25.02.2024 18:22:19

Nöe ,

aber hier ist ne Beschreibung
Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.

EDV ist die Abkürzung für: Ende der Vernunft

Bevor du einen Beitrag postest:
  • Kennst du unsere Verhaltensregeln
  • Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.

katzenfan
Beiträge: 579
Registriert: 19.04.2008 22:59:51

Re: Apertium - Programm zum maschinellen Übersetzen von Texten.

Beitrag von katzenfan » 25.02.2024 19:00:54

KBDCALLS hat geschrieben: ↑ zum Beitrag ↑
25.02.2024 18:22:19
aber hier ist ne Beschreibung
Ok; die hatte ich bereits gesichtet, aber offenbar nicht ausreichend; die Installation der Sprachpakete und dem dafür nötigen Rest ist insoweit nun erfolgt.

Allein; es klappt nicht

Code: Alles auswählen

***@linux:~$ apertium -f txt eng-deu <OmegaTest1.txt >OmegaTest1d.txt
/dev/fd/63: Zeile 1: lsx-proc: Kommando nicht gefunden.
/dev/fd/63: Zeile 1: lsx-proc: Kommando nicht gefunden.
Die Befehlszeile selber steht so in Bezug auf eine andere Sprachkombination als Beispiel
Sample:

Code: Alles auswählen

$ apertium -f txt es-ca <input >output
in der README.txt der Dokumentation zum Programm; sollte also mit meiner Variante nicht falsch sein.

In der README.txt des Sprachpaketes steht:
If you are in the source directory after running make, the following
commands should work:

$ echo "TODO test sentence 1" | apertium -d . eng-deu
das Resultat davon ist
***@linux:~$ echo "TODO test sentence 1" | apertium -d . eng-deu
Error: Directory './modes' does not exist.
USAGE: apertium [-d datadir] [-f format] [-u] <direction> [in [out]]
-d datadir directory of linguistic data
-f format one of: txt (default), html, rtf, odt, odp, docx, wxml, xlsx, pptx,
xpresstag, html-noent, html-alt, latex, latex-raw, line
-a display ambiguity
-u don't display marks '*' for unknown words
-n don't insert period before possible sentence-ends
-m memory.tmx use a translation memory to recycle translations
-o direction translation direction using the translation memory,
by default 'direction' is used instead
-l lists the available translation directions and exits
-V print Apertium version
-z force null-flush mode on all parts of the pipe
direction typically, LANG1-LANG2, but see modes.xml in language data
in input file (stdin by default)
out output file (stdout by default)
Dieses "Directory './modes'" gibt es aber und ist auch ordentlich derart befüllt, daß es auf Sprachpakete, u.a. auch "eng-deu" hinweist.

Code: Alles auswählen

/usr/share/apertium/modes/
Wo ist der Fehler?

Edit:
Möglicherweise ist es der . vor "./modes", der da nicht hingehört, aber in den Quelldateien irgendwo drinsteht?

Benutzeravatar
KBDCALLS
Moderator
Beiträge: 22359
Registriert: 24.12.2003 21:26:55
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Re: Apertium - Programm zum maschinellen Übersetzen von Texten.

Beitrag von KBDCALLS » 27.02.2024 12:35:51

Was ich jetzt nicht ganz nachvollziehen kann, wieso diese Klimmzüge? Die Sprachpakete sind doch im Repository.

  • Code: Alles auswählen

    
    rmadison apertium-dan-nor
    apertium-dan-nor | 1.3.0~r67099-2 | oldoldstable | source, all
    apertium-dan-nor | 1.4.1-2        | oldstable    | source, all
    apertium-dan-nor | 1.5.0-2        | stable       | source, all
    apertium-dan-nor | 1.5.0-2        | testing      | source, all
    apertium-dan-nor | 1.5.0-2        | unstable     | source, all
Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.

EDV ist die Abkürzung für: Ende der Vernunft

Bevor du einen Beitrag postest:
  • Kennst du unsere Verhaltensregeln
  • Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.

michaa7
Beiträge: 4633
Registriert: 12.12.2004 00:46:49
Lizenz eigener Beiträge: MIT Lizenz

Re: Apertium - Programm zum maschinellen Übersetzen von Texten.

Beitrag von michaa7 » 27.02.2024 13:24:23

KBDCALLS hat geschrieben: ↑ zum Beitrag ↑
27.02.2024 12:35:51
Was ich jetzt nicht ganz nachvollziehen kann, wieso diese Klimmzüge? Die Sprachpakete sind doch im ...
Ja, en, fr, es, pt und allemöglichen exoten (welsh, katalan, belarus, kaszachian, etc,) aber kein de/deu ...

Und mir scheint es als ob dieses Übersetzungsprogramm schwerpunktmäßig und bevorzugt ähnliche Sprachen bzw Dialekte innerhalb von Sprachfamilien (russich/romanisch/skandinavisch) übersetzt: sardisch-italienisch, spanisch-katalanisch, spanisch-aragonesich, maltesisch-arabisch, afrikaans-niederländisch, schwedisch-dänisch, russisch-ukrainisch, russisch-belarussisch ... etc.
gruß

michaa7

-------------------------------
Menschen ändern gelegentlich ihre Ansichten, aber nur selten ihre Motive. (Oskar Negt)

katzenfan
Beiträge: 579
Registriert: 19.04.2008 22:59:51

Re: Apertium - Programm zum maschinellen Übersetzen von Texten.

Beitrag von katzenfan » 03.03.2024 05:47:23

Das Sprachpaket ENG-DEU hat es bislang leider nur in der Entwicklerversion von apertium, auch für Debian als "deb" verfügbar, aber es funktioniert weiterhin nicht. Es hatte inzwischen zwar Updates für einige wenige Dateien, aber es kommen hier noch immer die gleichen Fehlermeldungen
katzenfan hat geschrieben: ↑ zum Beitrag ↑
25.02.2024 19:00:54

Code: Alles auswählen

***@linux:~$ apertium -f txt eng-deu <OmegaTest1.txt >OmegaTest1d.txt
/dev/fd/63: Zeile 1: lsx-proc: Kommando nicht gefunden.
/dev/fd/63: Zeile 1: lsx-proc: Kommando nicht gefunden.
***@linux:~$ echo "TODO test sentence 1" | apertium -d . eng-deu
Error: Directory './modes' does not exist.
...
@KBDCALLS
Benötigt werden Englisch-Deutsch und Französisch-Deutsch; diese hat es bislang nicht in der stabilen Version. Und in der unstabilen Version hat es zwar Englisch-Deutsch, aber Französisch-Deutsch auch nicht, dafür Englisch-Französisch.

dillo
Beiträge: 359
Registriert: 28.05.2005 19:53:56

Re: Apertium - Programm zum maschinellen Übersetzen von Texten.

Beitrag von dillo » 04.03.2024 13:04:31

katzenfan hat geschrieben:

Code: Alles auswählen

***@linux:~$ apertium -f txt eng-deu <OmegaTest1.txt >OmegaTest1d.txt
/dev/fd/63: Zeile 1: lsx-proc: Kommando nicht gefunden.
/dev/fd/63: Zeile 1: lsx-proc: Kommando nicht gefunden.

Code: Alles auswählen

~$ apt-file search lsx-proc
apertium-separable: /usr/bin/lsx-proc
Also das Paket apertium-separable installieren!
katzenfan hat geschrieben:

Code: Alles auswählen

***@linux:~$ echo "TODO test sentence 1" | apertium -d . eng-deu
Error: Directory './modes' does not exist.
Wenn du diesen Befehl in deinem Heimatverzeichnis aufrufst, muss es dort einen Link modes auf /usr/share/apertium/modes geben. Anlegen mit

Code: Alles auswählen

~$ ln -s  /usr/share/apertium/modes .
Dann klappt das:

Code: Alles auswählen

~$ echo "TODO test sentence 1" | apertium -d . eng-deu
*TODO Klausur Satz 1
Wie du siehst, ist die Übersetzung nicht unbedingt optimal...

Ein Satz des englischen Wikipediaeintags zu Linux wird so übersetzt:
#Linux ist #man von das #meist prominente Beispiele von frei und offen-Quelle Software Kollaboration. Der Quelle Code darf sein benutzt, modifiziert, und verteilte gewerblich oder nicht-gewerblich mal...
Da wäre noch einiges an Hand-/Nacharbeit nötig.

katzenfan
Beiträge: 579
Registriert: 19.04.2008 22:59:51

Re: Apertium - Programm zum maschinellen Übersetzen von Texten.

Beitrag von katzenfan » 04.03.2024 17:48:38

Danke für die Info, :THX: , und, ja, es funktioniert nun, und das Resultat ist nicht berauschend.

Aber es genügt, um auf diese Weise ins Deutsche übertragene Texte auch des EGMR grob zu sichten, um sie sich dann gegebenfalles nochmal, bspw., via deepl.com genauer anzusehen.

Wenn Apertium hier auch auf KI umstellt, sollten auch die Ergebnisse der Übersetzung besser werden, wobei es nicht auszuschließen ist, daß das aktuell nicht berauschende Resultat der Übersetzung Folge des sich noch in der Entwicklungsphase befindlichen Sprachpaketes ist.

Antworten