OpenAI lässt Entwickler Sprachfunktion nutzen

2. Oktober 2024 um 08:49
image
Sprechen statt Tippen: OpenAI öffnet die Speech-to-Speech-Funktion. Foto: Unsplash+

Developer können über die neue "Realtime API" auf die Speech-to-Speech-Funktion von ChatGPT zugreifen und sie in ihre Apps integrieren.

An seiner Devday-Veranstaltung hat der ChatGPT-Entwickler OpenAI einige Neuerungen für Developer vorgestellt. Dazu gehört die Realtime API, die ab sofort als Public-Beta-Version zur Verfügung steht. Die API basiere auf derselben Version von GPT-4o, die den erweiterten Sprachmodus in ChatGPT unterstütze, erklärt OpenAI.
Über die Schnittstelle erhalten App-Entwickler Zugang zu der Speech-to-Speech-Engine von OpenAI, was es ihnen ermöglicht, Sprachfunktionen in ihre Apps einzubauen. Dies mache es überflüssig, verschiedene Tools zusammenzuführen, die sonst für Transkription, Inferenz und Text-to-Speech in Sprachassistenten benötigt werden, so die Mitteilung des Unternehmens.
An der Präsentation illustrierte OpenAI die Funktion mit der App Wanderlust: Mit der Realtime API können Benutzer direkt mit der App sprechen und eine Reise in natürlicher Sprache planen. Dies sei nur ein Beispiel, heisst es von der KI-Firma weiter. Anwendungsfälle könnten von Sprach-Apps und Lernsoftware über Fitness-Apps bis hin zum Kundensupport reichen.
Zum Pricing schreibt das Unternehmen, dass sich die Kosten ungefähr auf 0,06 US-Dollar für eine Minute Audio-Input und auf 24 Cents pro Minute Audio-Output belaufen werden.

"Missbrauch ist nicht erlaubt"

App-Entwickler können über die Realtime API sechs von OpenAI bereitgestellte Stimmen nutzen. Diese unterscheiden sich von denen, die für ChatGPT angeboten werden. Aus Urheberrechtsgründen sei es nicht möglich, Stimmen von Drittanbietern zu verwenden, so die Mitteilung.
Mit Blick auf Missbrauch schreibt OpenAI, dass es gegen die Nutzungsrichtlinien verstosse, die Services zu nutzen, um andere zu spammen oder in die Irre zu führen. Man werde aktiv auf möglichen Missbrauch überwachen. "Unsere Richtlinien erfordern ausserdem, dass Entwickler ihren Benutzern deutlich machen, dass sie mit KI interagieren", so OpenAI. Wie sich das in der Praxis bewährt, bleibt abzuwarten.
Die API unterliege OpenAIs Datenschutzverpflichtungen für Unternehmen, was bedeute, dass Daten nicht für das Training von Modellen verwendet werden – ausser Unternehmen geben die ausdrückliche Genehmigung dafür.

Änderungen in der OpenAI-Geschäftsleitung

Erst kürzlich wurden einige prominente Abgänge bei OpenAI bekannt, darunter Chief Technology Officer Mira Murati und Chief Research Officer Bob McGrew. Diese hätten keinen Einfluss auf die Fortschritte beim Unternehmen, sagte Chief Product Officer Kevin Weil gemäss 'Techcrunch' vor Medien.
Die beiden seien "grossartige Führungspersönlichkeiten" gewesen und er habe viel von ihnen gelernt. Sie hätten dazu beigetragen, "uns dorthin zu bringen, wo wir heute sind", so Weil. Ihr Rücktritt bedeute aber nicht, dass OpenAI in seiner Entwicklung langsamer werde.

Loading

Mehr zum Thema

image

Schweizer KI-Startup Scalera sichert sich 6,5 Millionen Dollar

Das ETH-Spinoff bietet einen KI-basierten Ausschreibungs­assistenten, der Prozesse für Bau­unternehmen vereinfachen soll.

publiziert am 9.5.2025
image

ICT-Berufsbildung besetzt die neue KI-Fachstelle

Die Leitung der KI-Fachstelle übernimmt Tobias Habegger. Er soll sich der Integration von Künstlicher Intelligenz in der Berufsbildung widmen.

publiziert am 9.5.2025
image

Das sagen Schweizer Kunden und Partner zu Servicenow

An der Hausmesse des Softwareanbieters waren rund 100 Vertreterinnen und Vertreter von Schweizer Anwenderfirmen und Partnern. Von ihnen hat inside-it.ch einige Eindrücke eingesammelt.

publiziert am 9.5.2025
image

Microsoft verbietet eigenen Mitarbeitenden Deepseek

Aus Datenschutzgründen und Sorge vor Propaganda dürfen Angestellte von Microsoft die chinesische KI nicht verwenden.

publiziert am 9.5.2025