Der gewählte Tag war alles, aber sicher kein Zufall. Just 24 Stunden vor Googles lange avisierter Entwicklerkonferenz I/O lud OpenAI, Erschaffer des auf Künstlicher Intelligenz (KI) basierenden Chatbots ChatGPT, zu einer recht spontan einberufenen Präsentation. Federführend vorgetragen von OpenAIs Technik-Vorständin Mira Murati.

Vorgestellt wurde das neue KI-Modell GPT-4o, wobei das „o“ für „omni“ steht. Was bedeutet, dass das Modell multimodal funktioniert. Und zwar beidseitig, also sowohl beim Input, als auch bei der anschließenden Erstellung eigener Inhalte. Besonders viel Echo erhielt diesmal aber die Möglichkeit, sich via GPT-4o mit ChatGPT zu unterhalten. Bisher konnte man den Chatbot ja nur über Umwege per Sprache steuern. Tat man das, arbeiteten gleich drei KI-Modelle verschränkt: Eines übersetzte die Sprache in Text, das zweite antwortet auf den Text mit Text, das dritte machte aus dem Antworttext wieder Sprache. Ein Vorgang, der in Summe für sekundenlange Wartezeiten nach der Frage sorgte und die Unterhaltung verkomplizierte.

Ein Modell reicht aus

Bei GPT-4o, dort arbeitet nur mehr ein neuronales Netzwerk, soll die gesprochene Antwort nun binnen 300 Millisekunden erfolgen. Zugleich bekam die Stimme der KI eine deutlich menschlichere Färbung. Bei der Demo selbst hatte OpenAI freilich massig Anwendungs-Beispiele für die neue KI dabei. Und so erzählte ChatGPT dramatische Gute-Nacht-Geschichten, fungierte als Simultan-Dolmetscher für Italienisch und Englisch und begann gar zu singen.

Von einem potenziellen „Siri-Killer“ spricht der deutsche Technologie-Experte Philipp Klöckner im Nachhall und in Anlehnung an Apples Sprachassistentin. OpenAI selbst bemüht sich wiederum selbst sehr aktiv um Vergleich mit dem 2013 erschienen Spike-Jonze-Blockbuster „Her“. Darin verliebt sich der schüchterne Jonathan in Samantha, die Stimme einer besonders empathisch auftretenden Künstlichen Intelligenz.

Unklar ist noch, wann welche der neuen Funktionen wirklich verfügbar sein wird. Aktuell spricht man im Sprach-Modus laut OpenAI-Chef Sam Altman noch nicht mit GPT-4o, während in der Verschriftlichung bereits das neue Modell arbeitet.

Künstliche Intelligenz

ChatGPT kann sprechen und singen wie im Hollywood-Film

ChatGPT hat Ratschläge beim Rechnen geben

Insider berichtet über OpenAI-Plan

KI-Suchmaschine: Chat-GPT-Macher wollen jetzt Google Konkurrenz machen

Wie KI auf die Jobs wirkt

Ein neues Zeitalter der Arbeit zieht auf

Analyse

Die Entwicklung der Arbeitswelt, wie sie eine KI sieht

Falsche Angaben zu Personen

Max Schrems & Co reichen Beschwerde gegen OpenAI und ChatGPT ein

Hält auch Konzerne wie Meta juristisch auf Trab: Max Schrems

KI-Spezialistin Vanessa Cann

KI aus Europa? „Haben Chance, Anwendungsweltmeister zu werden“

von Markus Zottler

TU-Rektor und KI-Experte Horst Bischof

KI-Hype: „Dass Jobs verschwinden werden, steht außer Zweifel, aber . . .“

Interview

Horst Bischof: TU-Rektor, Informatiker, Vorsitzender des KI-Beirats

Neues KI-Modell GPT-4o

Wie ChatGPT zur Simultan-Dolmetscherin wird