Der ChatGPT-Entwickler OpenAI hat ein neues KI-Modell vorgestellt, das komplexere Aufgaben als bisherige Chatbots lösen kann. Die Software mit dem Namen o1 verbringe dafür mehr Zeit mit „Nachdenken“, bevor sie eine Antwort gibt – „so wie eine Person es machen würde“. Die Künstliche Intelligenz probiere dabei verschiedene Ansätze aus und erkenne und korrigiere ihre eigenen Fehler, erläutert OpenAI in einem Blogeintrag.
Das zeige unter anderem bei Mathematik und dem Programmieren von Software Wirkung. So habe das o1-Modell 83 Prozent der Aufgaben der Prüfung für die Internationale Mathematik-Olympiade gelöst. Das aktuelle ChatGPT-4o sei lediglich auf 13 Prozent gekommen. Zugleich fehlten bei dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So könne es nicht im Web nach Informationen suchen und unterstütze nicht das Hochladen von Dateien und Bildern – und ist bisher auch langsamer.
Aus Sicht von OpenAI kann das neue Modell etwa Forscher*innen bei der Datenanalyse oder Physikern bei komplexen mathematischen Formeln helfen.
Auch neue Software erfindet manchmal Antworten
Aus den Unterlagen geht zugleich hervor, dass das neue Modell bei einer Testauswahl von 100.000 Anfragen in 0,38 Prozent der Fälle wissentlich eine falsche Antwort gab. Das sei vor allem passiert, wenn OpenAI o1 darum gebeten worden sei, auf Artikel, Websites oder Bücher zu verweisen. Das war aber ohne Zugang zur Internet-Suche in vielen Fällen nicht möglich. So erfand die Software selber plausibel aussehende Beispiele. Die Software habe aber stets nur die Wünsche der Nutzer erfüllen wollen. Die sogenannten „Halluzinationen“, bei denen KI-Software Informationen einfach erfindet, sind generell ein bisher ungelöstes Problem.
ChatGPT ist der Chatbot, der vor über einem Jahr den Hype um Künstliche Intelligenz auslöste. Solche KI-Programme werden mit gewaltigen Mengen an Informationen trainiert und können Texte auf dem sprachlichen Niveau eines Menschen formulieren, Software-Code schreiben und Informationen zusammenfassen. Das Prinzip dahinter ist, dass sie Wort für Wort abschätzen, wie ein Satz weitergehen sollte.
ls/dpa