Mit ChatGPT kann man jetzt richtig reden
Dieser Artikel ist älter als ein Jahr!
Knapp ein Jahr nachdem ChatGPT erstmals der Öffentlichkeit zugänglich gemacht wurde stellt OpenAI, die Firma, die hinter dem Chatbot steckt, ein extrem wichtiges Update vor. Es betrifft nicht nur Verbesserungen bei den Inhalten, sondern Grundlegendes. Wer bisher mit ChatGPT sprechen wollte, musste dazu seinen „prompt“ (Befehl) eingeben, um dem Chatbot das Gewünschte zu entlocken. Nun hat OpenAI aber im Hintergrund an neuen, praktischen Features gearbeitet, die das Bedienerlebnis verändern.
Spracheingaben wie bei Alexa, nur mit besseren Antworten
Eines davon betrifft die Art und Weise, wie wir mit ChatGPT kommunizieren. Künftig soll man mit dem Chatbot auch richtig sprechen können, er soll also auf Spracheingaben reagieren. Das berichtet The Verge. Das mit der Spracheingabe soll ähnlich funktionieren wie bei Alexa oder Siri.
Man drückt auf einen Knopf und spricht seine Frage rein. ChatGPT wandelt die Sprachnachricht in Text um und füttert damit das große Sprachmodell im Hintergrund. Im Anschluss wandelt es die Antwort wieder in Sprache um und antwortet laut.
Es ist etwa so, wie wenn man mit Alexa oder Siri spricht – nur, dass die Antworten viel besser sein sollen. Das neue Feature soll zunächst für die Bezahl-Versionen von ChatGPT sowie für Unternehmens-Kund*innen ausgerollt werden und zwar in den nächsten 2 Wochen. „Kurze Zeit später“ sollen alle Nutzer*innen darauf zugreifen können.
➤ Mehr lesen: ChatGPT: 5 hilfreiche Funktionen, die den Alltag erleichtern
Bilder hochladen für eine Funktion, die ähnlich wie Google Lens ist
Doch das ist nicht die einzige Neuheit von OpenAI. Es ist auch eine neue Funktion geplant, die Bilder betrifft. Diese darf man sich ähnlich wie Google Lens vorstellen. Man nimmt ein Foto von etwas auf, das einem interessiert und lädt es bei ChatGPT hoch. ChatGPT fragt dann in Folge nach, was einem daran interessiert und generiert im Anschluss die passende Antwort. Mit der richtigen Eingabe ist die Chance, dass man gleich die richtige Antwort erhält, größer als bei einer herkömmlichen Suchanfrage. Auch Google arbeitet bereits an dieser multimodalen Suche. ChatGPT setzt sie jetzt einfach um.
Es gibt jedoch auch Limits. Und zwar dann, wenn auf den hochgeladenen Fotos Persönlichkeiten zu sehen sind. Hier wird ChatGPT aus Privatsphäre-Gründen keine Antworten geben auf Fragen zu einzelnen Personen. Die in Science-Fiction-Serien oft propagierte Vision, eine KI einfach zu fragen, wen man vor einen hat, wird somit erst einmal nicht Wirklichkeit.
Gesprochene Stimme imitieren und Fotos per Chat generieren lassen
Auch bei KI-Sprache macht OpenAI mitunter große Fortschritte. So hat die Firma ein Modell entwickelt, mit der man die KI mit seiner Stimme trainieren kann, um dann gesprochene Texte in fremde Sprachen zu übersetzen. Das könnte etwa für Podcaster*innen interessant sein, um ihre Podcasts in anderen Sprachen anzubieten. Da dieses Feature aber großes Missbrauchspotential hat soll es nicht allen frei zugänglich gemacht werden, heißt es im Bericht.
Neues gibt es auch bei DALL-E, dem KI-Bildgenerator von OpenAI. Dieser kann künftig mit ChatGPT bedient werden. Man kann dem Bildgenerator also viel intuitiver als bisher erklären, was man eigentlich für Bilder haben möchte. Insgesamt setzt OpenAI damit neue Standards, was generative KI betrifft und hat einmal mehr die Nase vorn.
➤ Mehr lesen: OpenAI stellt DALL-E 3 vor: Was der neue Bildgenerator besser kann
Kommentare