ChatGPT-Entwickler OpenAI hat ein neues KI-Modell vorgestellt, das komplexere Aufgaben besser als bisherige Chatbots lösen soll. Es heisst o1-Preview und verbringe mehr Zeit mit "Nachdenken", bevor es eine Antwort gibt – "so wie eine Person es machen würde", heisst es von OpenAI.
Modell probiert verschiedene Lösungsansätze aus
Die Künstliche Intelligenz probiere dabei verschiedene Ansätze aus und erkenne und korrigiere ihre eigenen Fehler, erläutert OpenAI
in einem Blogeintrag. Dabei soll man verfolgen können, wie das Modell "denkt". Anwenderinnen und Anwender könnten so Schritt für Schritt nachvollziehen, wie o1-Preview zu seinen Antworten kommt.
Das zeige unter anderem bei Mathematik und dem Programmieren von Software Wirkung. So habe das o1-Preview-Modell 83% der Aufgaben der Prüfung für die internationale Mathematik-Olympiade gelöst. Das aktuelle ChatGPT-4o sei lediglich auf 13% gekommen.
o-mini für Entwicklerinnen und Entwickler
Zugleich fehlten bei dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So könne es nicht im Web nach Informationen suchen und unterstütze nicht das Hochladen von Dateien und Bildern – und ist bisher auch langsamer.
Aus Sicht von OpenAI kann das neue Modell etwa Forschern bei der Datenanalyse oder Physikerinnen bei komplexen mathematischen Formeln helfen. Speziell für Entwickler hat OpenAI zusätzlich das Sprachmodell "o1-mini" lanciert, das sich besonders gut für das Codieren eignen soll. Es ist für Aufgaben konzipiert, "die logisches Denken, aber kein umfassendes Weltwissen erfordern", so der Anbieter.
Auch neues Modell erfindet Antworten
Aus den Unterlagen geht zugleich hervor, dass das neue Modell bei einer Testauswahl von 100'000 Anfragen in 0,38% der Fälle wissentlich eine falsche Antwort gab. Das sei vor allem passiert, wenn OpenAI o1-Preview darum gebeten worden sei, auf Artikel, Websites oder Bücher zu verweisen.
Das war aber ohne Zugang zur Internet-Suche in vielen Fällen nicht möglich. So erfand die Software selber plausibel aussehende Beispiele. Die Software habe aber stets nur die Wünsche der Nutzer erfüllen wollen.