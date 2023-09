ChatGPT kann bald nicht mehr nur per Texteingabe benutzt werden, sondern auch anders.

Es ist etwa so, wie wenn man mit Alexa oder Siri spricht – nur, dass die Antworten viel besser sein sollen. Das neue Feature soll zunächst für die Bezahl-Versionen von ChatGPT sowie für Unternehmens-Kund*innen ausgerollt werden und zwar in den nächsten 2 Wochen. „Kurze Zeit später“ sollen alle Nutzer*innen darauf zugreifen können.

Man drückt auf einen Knopf und spricht seine Frage rein. ChatGPT wandelt die Sprachnachricht in Text um und füttert damit das große Sprachmodell im Hintergrund. Im Anschluss wandelt es die Antwort wieder in Sprache um und antwortet laut.

Eines davon betrifft die Art und Weise, wie wir mit ChatGPT kommunizieren. Künftig soll man mit dem Chatbot auch richtig sprechen können, er soll also auf Spracheingaben reagieren. Das berichtet The Verge . Das mit der Spracheingabe soll ähnlich funktionieren wie bei Alexa oder Siri.

Knapp ein Jahr nachdem ChatGPT erstmals der Öffentlichkeit zugänglich gemacht wurde stellt OpenAI , die Firma, die hinter dem Chatbot steckt, ein extrem wichtiges Update vor. Es betrifft nicht nur Verbesserungen bei den Inhalten, sondern Grundlegendes. Wer bisher mit ChatGPT sprechen wollte, musste dazu seinen „prompt“ (Befehl) eingeben, um dem Chatbot das Gewünschte zu entlocken. Nun hat OpenAI aber im Hintergrund an neuen, praktischen Features gearbeitet, die das Bedienerlebnis verändern.

Bilder hochladen für eine Funktion, die ähnlich wie Google Lens ist

Doch das ist nicht die einzige Neuheit von OpenAI. Es ist auch eine neue Funktion geplant, die Bilder betrifft. Diese darf man sich ähnlich wie Google Lens vorstellen. Man nimmt ein Foto von etwas auf, das einem interessiert und lädt es bei ChatGPT hoch. ChatGPT fragt dann in Folge nach, was einem daran interessiert und generiert im Anschluss die passende Antwort. Mit der richtigen Eingabe ist die Chance, dass man gleich die richtige Antwort erhält, größer als bei einer herkömmlichen Suchanfrage. Auch Google arbeitet bereits an dieser multimodalen Suche. ChatGPT setzt sie jetzt einfach um.

Es gibt jedoch auch Limits. Und zwar dann, wenn auf den hochgeladenen Fotos Persönlichkeiten zu sehen sind. Hier wird ChatGPT aus Privatsphäre-Gründen keine Antworten geben auf Fragen zu einzelnen Personen. Die in Science-Fiction-Serien oft propagierte Vision, eine KI einfach zu fragen, wen man vor einen hat, wird somit erst einmal nicht Wirklichkeit.

Gesprochene Stimme imitieren und Fotos per Chat generieren lassen

Auch bei KI-Sprache macht OpenAI mitunter große Fortschritte. So hat die Firma ein Modell entwickelt, mit der man die KI mit seiner Stimme trainieren kann, um dann gesprochene Texte in fremde Sprachen zu übersetzen. Das könnte etwa für Podcaster*innen interessant sein, um ihre Podcasts in anderen Sprachen anzubieten. Da dieses Feature aber großes Missbrauchspotential hat soll es nicht allen frei zugänglich gemacht werden, heißt es im Bericht.

Neues gibt es auch bei DALL-E, dem KI-Bildgenerator von OpenAI. Dieser kann künftig mit ChatGPT bedient werden. Man kann dem Bildgenerator also viel intuitiver als bisher erklären, was man eigentlich für Bilder haben möchte. Insgesamt setzt OpenAI damit neue Standards, was generative KI betrifft und hat einmal mehr die Nase vorn.

