Gesprochene Audiodatei zu Textdatei

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
Benutzeravatar
matman
Beiträge: 744
Registriert: 03.07.2008 10:50:07
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Hamburg
Kontaktdaten:

Gesprochene Audiodatei zu Textdatei

Beitrag von matman » 17.09.2022 19:03:43

Eine gesprochene Audiodatei zu einer Textdatei umwandeln. Gibt es da bei Linux schon Tools die das können?
System: Bullseye
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525

tobo
Beiträge: 1990
Registriert: 10.12.2008 10:51:41

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von tobo » 17.09.2022 19:42:31

matman hat geschrieben: ↑ zum Beitrag ↑
17.09.2022 19:03:43
Eine gesprochene Audiodatei zu einer Textdatei umwandeln. Gibt es da bei Linux schon Tools die das können?
Gute Frage. Wenn nichts Konkretes kommt, dann würde ich mal hier ansetzen:
https://en.wikipedia.org/wiki/Speech_re ... _for_Linux

tonerzeuger
Beiträge: 46
Registriert: 06.10.2017 16:38:10

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von tonerzeuger » 17.09.2022 22:24:05

Es gibt zumindest einen Ansatz für ein freies, nichtkommerzielles System: Mozilla Common Voice.

Darauf basiert die Spracherkennung Deep Speech, und dazu gibt es sogar ein Tutorial bei Heise:
https://www.heise.de/hintergrund/Mozill ... 48698.html

Vielleicht hilft das weiter? Es scheint aber noch in der Entwicklung zu sein, und jede(r) kann eigene Sprachaufnahmen einsenden, um zur Verbesserung beizutragen. :THX:
https://commonvoice.mozilla.org/de/datasets

tobo
Beiträge: 1990
Registriert: 10.12.2008 10:51:41

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von tobo » 17.09.2022 22:46:58

tonerzeuger hat geschrieben: ↑ zum Beitrag ↑
17.09.2022 22:24:05
Es scheint aber noch in der Entwicklung zu sein, [...]
Laut Referenz [4] aus dem Wikipedia-Link scheint das schon wieder tot zu sein:
https://discourse.mozilla.org/t/why-you ... i-ai/82798

tonerzeuger
Beiträge: 46
Registriert: 06.10.2017 16:38:10

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von tonerzeuger » 17.09.2022 22:56:40

Das hab ich auch gerade gelesen - immerhin ist es geforked worden.

In diesem zwei Jahre alten Artikel werden weitere Projekte vorgestellt:
https://gnulinux.ch/open-source-spracherkennung

tonerzeuger
Beiträge: 46
Registriert: 06.10.2017 16:38:10

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von tonerzeuger » 01.11.2022 11:09:27

Berichte doch Mal, was Du probiert hast und was dabei rauskam - das wäre sicher nicht nur für mich interessant!

Benutzeravatar
matman
Beiträge: 744
Registriert: 03.07.2008 10:50:07
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Hamburg
Kontaktdaten:

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von matman » 19.02.2023 12:55:49

Ich habe da bis jetzt noch nicht viel gemacht. Und im Moment wichtigeres zu tun. In den Debian Repos, das man mal schnell installieren und testen könnte, gibt es wohl nichts?
System: Bullseye
Hardware: Gigabyte 970A-DS3P mit AMD FX-6300, Kingston HyperX DDR3-1333 (4x4GB), Samsung SSD 860 EVO, HGST Travelstar 7K1000, Samsung DVD-ROM SH-D162D, Geforce GTX 1050, SoundBlaster Live! Platinum, Hauppauge WinTV-HVR-5525

Benutzeravatar
GregorS
Beiträge: 2596
Registriert: 05.06.2008 09:36:37
Wohnort: Freiburg
Kontaktdaten:

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von GregorS » 19.02.2023 14:08:54

matman hat geschrieben: ↑ zum Beitrag ↑
19.02.2023 12:55:49
Ich habe da bis jetzt noch nicht viel gemacht. Und im Moment wichtigeres zu tun. In den Debian Repos, das man mal schnell installieren und testen könnte, gibt es wohl nichts?
Dann guck Dir doch wenigstens mal kurz die zwei Postings weiter oben verlinkte Seite an. Es scheint einiges zu geben.

Gruß

Gregor
Wenn man keine Probleme hat, kann man sich welche machen. ("Großes Lötauge", Medizinmann der M3-Hopi [und sog. Maker])

rjh

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von rjh » 20.02.2023 20:30:42

matman hat geschrieben: ↑ zum Beitrag ↑
19.02.2023 12:55:49
In den Debian Repos, das man mal schnell installieren und testen könnte, gibt es wohl nichts?
Zum schnellen installieren und testen:

Debianpocketsphinx_continuous

Code: Alles auswählen

pocketsphinx_continuous -infile test-enc.wav
wave-Datei muss ne Samplerate von 16000 haben. Der Text sollte Englisch sein (gibt aber soweit ich weiß auch schon Erweiterungen für Deutsch).

Benutzeravatar
speefak
Beiträge: 449
Registriert: 27.04.2008 13:54:20

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von speefak » 24.07.2023 13:31:36

Das würde mich auch interessieren. Es wäre wünschenswert ein ChatGPT/Alexa/Siri usw. System ohne "ET Faktor (nach Hause telefonieren)" zu bekommen, was völlig ohne Onlinefunktionen auskommt. MyCroft hatte ich einmal getestet. Gibt aber keine Server/Client Betrieb, sprich alles muss auf einem System laufen.

reox
Beiträge: 2463
Registriert: 06.06.2006 22:09:47
Lizenz eigener Beiträge: MIT Lizenz

Re: Gesprochene Audiodatei zu Textdatei

Beitrag von reox » 24.07.2023 13:36:13

Hier findet man einige modelle: https://github.com/topics/speech-to-text
Whisper wird mittlerweile auch in HomeAssistant angeboten aber die Qualität ist oftmals sehr schlecht. Allerdings teilweise überraschend gut. Also muss man sich anschauen ob es funktioniert.
Ob die Modelle komplett offen (=auch alle trainingsdaten vorhanden) sind weiß ich nicht, muss man vermutlich im Einzelfall ansehen.

Antworten