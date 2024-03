OpenAI arbeitet an einem KI-Modell, das Stimmen imitieren kann. "Voice Engine" soll Textpassagen in jeder Stimme wiedergeben können. Dafür sei lediglich eine 15 Sekunden lange Audiodatei mit einem Beispiel nötig. Voice Engine wird aktuell im kleinen Rahmen getestet, heißt es in einem Blogeintrag.

Das KI-Modell wurde bereits 2022 entwickelt und diente als Grundlage für Text-zu-Sprache-Anwendungen wie "ChatGPT Voice" und "Read Aloud". Letzteres Feature kann Inhalte von hochgeladenen Fotos, etwa von Buchseiten, vorlesen. Auch für "HeyGen", ein Tool, das Videos übersetzt und Lippenbewegungen automatisch anpasst, kommt Voice Engine zum Einsatz.

