An seiner Devday-Veranstaltung hat der ChatGPT-Entwickler OpenAI einige Neuerungen für Developer vorgestellt. Dazu gehört die Realtime API, die ab sofort als Public-Beta-Version zur Verfügung steht. Die API basiere auf derselben
Version von GPT-4o, die den erweiterten Sprachmodus in ChatGPT unterstütze, erklärt OpenAI.
Über die Schnittstelle erhalten App-Entwickler Zugang zu der Speech-to-Speech-Engine von OpenAI, was es ihnen ermöglicht, Sprachfunktionen in ihre Apps einzubauen. Dies mache es überflüssig, verschiedene Tools zusammenzuführen, die sonst für Transkription, Inferenz und Text-to-Speech in Sprachassistenten benötigt werden, so die Mitteilung des Unternehmens.
An der Präsentation illustrierte OpenAI die Funktion mit der App Wanderlust: Mit der Realtime API können Benutzer direkt mit der App sprechen und eine Reise in natürlicher Sprache planen. Dies sei nur ein Beispiel, heisst es von der KI-Firma weiter. Anwendungsfälle könnten von Sprach-Apps und Lernsoftware über Fitness-Apps bis hin zum Kundensupport reichen.
Zum Pricing schreibt das Unternehmen, dass sich die Kosten ungefähr auf 0,06 US-Dollar für eine Minute Audio-Input und auf 24 Cents pro Minute Audio-Output belaufen werden.
"Missbrauch ist nicht erlaubt"
App-Entwickler können über die Realtime API sechs von OpenAI bereitgestellte Stimmen nutzen. Diese unterscheiden sich von denen, die für ChatGPT angeboten werden. Aus Urheberrechtsgründen sei es nicht möglich, Stimmen von Drittanbietern zu verwenden, so die Mitteilung.
Mit Blick auf Missbrauch schreibt OpenAI, dass es gegen die Nutzungsrichtlinien verstosse, die Services zu nutzen, um andere zu spammen oder in die Irre zu führen. Man werde aktiv auf möglichen Missbrauch überwachen. "Unsere Richtlinien erfordern ausserdem, dass Entwickler ihren Benutzern deutlich machen, dass sie mit KI interagieren", so OpenAI. Wie sich das in der Praxis bewährt, bleibt abzuwarten.
Die API unterliege OpenAIs Datenschutzverpflichtungen für Unternehmen, was bedeute, dass Daten nicht für das Training von Modellen verwendet werden – ausser Unternehmen geben die ausdrückliche Genehmigung dafür.
Änderungen in der OpenAI-Geschäftsleitung
Die beiden seien "grossartige Führungspersönlichkeiten" gewesen und er habe viel von ihnen gelernt. Sie hätten dazu beigetragen, "uns dorthin zu bringen, wo wir heute sind", so Weil. Ihr Rücktritt bedeute aber nicht, dass OpenAI in seiner Entwicklung langsamer werde.