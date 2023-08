SeamlessM4T heißt das neue KI-Modell von Meta, mit dem sich Texte und Sprache übersetzen lassen. Wenn man dieses KI-Tool beispielsweise in Apps einbauen würde, könnte sich damit sprachübergreifende Kommunikation deutlich verbessern. SeamlessM4T soll laut Meta ein „ Durchbruch “ sein, wenn es um KI-gestützte Übersetzung geht. Es lässt sich damit das gesprochene Wort gleichermaßen übersetzen wie das geschriebene Wort. Dazwischen soll keine Spracherkennung notwendig sein, wie es bisher der Fall war. Damit wird die Effizienz bei Übersetzungen erhöht, und Fehler und Verzögerungen können vermieden werden.

Das KI-Modell wurde mit 4 Millionen Stunden Sprachdateien aus öffentlich zugänglichen Quellen trainiert, heißt es bei Techcrunch. Das Modell wird außerdem unter eine offene CC BY-NC 4.0 Lizenz veröffentlicht, ist also Open-Source. Die Sprachübersetzungsfunktion soll aber ganz vorsichtig eingeführt werden. Meta selbst warnt davor, das KI-Modell für Texte einzusetzen, bei denen es um Genauigkeit geht, also etwa juristische oder medizinische Texte.

Was hinter dem Modell steckt

SeamlessM4T ist so etwas wie ein Nachfolger von Metas No Language Left Behind, einem maschinellen Text-zu-Text-Übersetzungsmodell, und Universal Speech Translator, einem der wenigen direkten Sprache-zu-Sprache-Übersetzungssysteme. Es baut auf Massively Multilingual Speech auf, dem Framework von Meta, das Spracherkennung und Sprachsynthese für mehr als 1.100 Sprachen bietet.

Neben Meta entwickeln auch weitere Firmen Sprachübersetzungsmodelle, etwa Amazon, Microsoft, OpenAI und eine Reihe Start-ups. Mozilla war etwa Vorreiter bei Common Voice, einer der größten mehrsprachigen Stimmensammlungen zum Trainieren automatischer Spracherkennungsalgorithmen.