Neues KI-Modell von OpenAI da – es heisst nicht mehr GPT

13. September 2024 um 06:51
image

Hinter dem Codenamen "Strawberry" verbirgt sich OpenAIs neues KI-Modell. Ab sofort steht "o1-Preview" allen Bezahlkunden zur Verfügung.

ChatGPT-Entwickler OpenAI hat ein neues KI-Modell vorgestellt, das komplexere Aufgaben besser als bisherige Chatbots lösen soll. Es heisst o1-Preview und verbringe mehr Zeit mit "Nachdenken", bevor es eine Antwort gibt – "so wie eine Person es machen würde", heisst es von OpenAI.

Modell probiert verschiedene Lösungsansätze aus

Die Künstliche Intelligenz probiere dabei verschiedene Ansätze aus und erkenne und korrigiere ihre eigenen Fehler, erläutert OpenAI in einem Blogeintrag. Dabei soll man verfolgen können, wie das Modell "denkt". Anwenderinnen und Anwender könnten so Schritt für Schritt nachvollziehen, wie o1-Preview zu seinen Antworten kommt.
Das zeige unter anderem bei Mathematik und dem Programmieren von Software Wirkung. So habe das o1-Preview-Modell 83% der Aufgaben der Prüfung für die internationale Mathematik-Olympiade gelöst. Das aktuelle ChatGPT-4o sei lediglich auf 13% gekommen.

o-mini für Entwicklerinnen und Entwickler

Zugleich fehlten bei dem neuen Modell noch viele nützliche Funktionen von ChatGPT. So könne es nicht im Web nach Informationen suchen und unterstütze nicht das Hochladen von Dateien und Bildern – und ist bisher auch langsamer.
Aus Sicht von OpenAI kann das neue Modell etwa Forschern bei der Datenanalyse oder Physikerinnen bei komplexen mathematischen Formeln helfen. Speziell für Entwickler hat OpenAI zusätzlich das Sprachmodell "o1-mini" lanciert, das sich besonders gut für das Codieren eignen soll. Es ist für Aufgaben konzipiert, "die logisches Denken, aber kein umfassendes Weltwissen erfordern", so der Anbieter.

Auch neues Modell erfindet Antworten

Aus den Unterlagen geht zugleich hervor, dass das neue Modell bei einer Testauswahl von 100'000 Anfragen in 0,38% der Fälle wissentlich eine falsche Antwort gab. Das sei vor allem passiert, wenn OpenAI o1-Preview darum gebeten worden sei, auf Artikel, Websites oder Bücher zu verweisen.
Das war aber ohne Zugang zur Internet-Suche in vielen Fällen nicht möglich. So erfand die Software selber plausibel aussehende Beispiele. Die Software habe aber stets nur die Wünsche der Nutzer erfüllen wollen.

Loading

Mehr zum Thema

image

SBB erteilen Auftrag für Swisspass-Verifikation

Intrum erhält den Zuschlag für die digitale Identitätsprüfung. Diese soll beim Swisspass weiterentwickelt werden.

publiziert am 2.12.2024
image

Jede dritte Schweizer Firma gut auf KI vorbereitet

Ein Drittel der Schweizer Unternehmen sieht sich beim Thema KI gut aufgestellt. Im europäischen Vergleich liegt die Schweiz damit aber nur im Mittelfeld.

publiziert am 29.11.2024
image

Kanton Luzern vergibt Auftrag für KI-Chatbot

Im Januar soll der Chatbot für die kantonalen Websites starten. Swiss Moonshot hat sich gegen 25 Mitbewerber durchgesetzt.

publiziert am 29.11.2024
image

Finma findet Provider für Kernplattform

Die Kernplattform Sirius 2.0 der Finanzmarktaufsicht soll umfassend erneuert werden. Dafür erhält Nexplore den Zuschlag von gut 30 Millionen Franken.

publiziert am 28.11.2024