Der gewählte Tag war alles, aber sicher kein Zufall. Just 24 Stunden vor Googles lange avisierter Entwicklerkonferenz I/O lud OpenAI, Erschaffer des auf Künstlicher Intelligenz (KI) basierenden Chatbots ChatGPT, zu einer recht spontan einberufenen Präsentation. Federführend vorgetragen von OpenAIs Technik-Vorständin Mira Murati.
Vorgestellt wurde das neue KI-Modell GPT-4o, wobei das „o“ für „omni“ steht. Was bedeutet, dass das Modell multimodal funktioniert. Und zwar beidseitig, also sowohl beim Input, als auch bei der anschließenden Erstellung eigener Inhalte. Besonders viel Echo erhielt diesmal aber die Möglichkeit, sich via GPT-4o mit ChatGPT zu unterhalten. Bisher konnte man den Chatbot ja nur über Umwege per Sprache steuern. Tat man das, arbeiteten gleich drei KI-Modelle verschränkt: Eines übersetzte die Sprache in Text, das zweite antwortet auf den Text mit Text, das dritte machte aus dem Antworttext wieder Sprache. Ein Vorgang, der in Summe für sekundenlange Wartezeiten nach der Frage sorgte und die Unterhaltung verkomplizierte.
Ein Modell reicht aus
Bei GPT-4o, dort arbeitet nur mehr ein neuronales Netzwerk, soll die gesprochene Antwort nun binnen 300 Millisekunden erfolgen. Zugleich bekam die Stimme der KI eine deutlich menschlichere Färbung. Bei der Demo selbst hatte OpenAI freilich massig Anwendungs-Beispiele für die neue KI dabei. Und so erzählte ChatGPT dramatische Gute-Nacht-Geschichten, fungierte als Simultan-Dolmetscher für Italienisch und Englisch und begann gar zu singen.
Von einem potenziellen „Siri-Killer“ spricht der deutsche Technologie-Experte Philipp Klöckner im Nachhall und in Anlehnung an Apples Sprachassistentin. OpenAI selbst bemüht sich wiederum selbst sehr aktiv um Vergleich mit dem 2013 erschienen Spike-Jonze-Blockbuster „Her“. Darin verliebt sich der schüchterne Jonathan in Samantha, die Stimme einer besonders empathisch auftretenden Künstlichen Intelligenz.
Unklar ist noch, wann welche der neuen Funktionen wirklich verfügbar sein wird. Aktuell spricht man im Sprach-Modus laut OpenAI-Chef Sam Altman noch nicht mit GPT-4o, während in der Verschriftlichung bereits das neue Modell arbeitet.