Nvidia veröffentlicht neues KI-Sprach­er­kennungs­modell

6. Mai 2025 um 14:05
image
Foto: Getty Images / Unsplash+

Nvidia hat ein automatisches Spracherkennungsmodell präsentiert, das eine Stunde Audiomaterial in nur einer Sekunde transkribieren kann.

Der Grafikkartenhersteller Nvidia ist vor allem für seine Hardware bekannt. Dank dem KI-Boom ist das Unternehmen aber so stark gewachsen, dass es mittlerweile auch eigene Software entwickelt. So hat Nvidia ein neues auto­ma­ti­sches Spracherkennungsmodell veröffentlicht, das Audioaufnahmen von einer Stunde in nur wenigen Sekunden transkribieren kann.
Das KI-Modell mit der Bezeichnung Parakeet-TDT-0.6B-v2 wurde als Open Source unter einer freien Creative-Commons-Lizenz veröffentlicht. Eine Vorgängerversion des Modells kam bereits im Januar 2024 auf den Markt. Das neue Modell soll sich aber in puncto Leistungsfähigkeit und Fehleranfälligkeit deutlich vom Vorgänger abheben.
So erreichte das Modell auf Hugging Face Open ASR mit einer Fehlerrate von nur 6,05% einen Spitzenplatz. Die Software spielt damit in einer Liga mit Spracherkennungssystemen von OpenAI oder Elevenlab. Gleichzeitig lieferte das Modell bei dem Benchmark-Test eine enorm hohe Geschwindigkeit.
Das Modell ist seit dem 1. Mai weltweit verfügbar. Es richtet sich an For­scherinnen und Entwickler von Sprache-zu-Text-Systemen. Dafür unterstützt es Interpunktion, Grossschreibung und detaillierte Zeitstempel auf Wort­ebene. So soll das Modell ein komplettes Transkriptionspaket für eine breite Palette von Sprache-zu-Text-Anforderungen bieten.

Loading

Mehr zum Thema

image

OpenAI bezahlt offenbar drei Milliarden für Code-Startup Windsurf

Ein Kauf des KI-Tools für Coding wäre die bisher grösste Übernahme des ChatGPT-Entwicklers.

publiziert am 6.5.2025
image

OpenAI nimmt Pläne für Gewinnorientierung zurück

Das seltsame Konstrukt einer Non-Profit-Organisation, die ein gewinnorientiertes Unternehmen kontrollieren soll, bleibt aber bestehen.

publiziert am 6.5.2025
image

Apple warnt vor staatlicher Spyware

Der iPhone-Hersteller hat Personen aus 100 Ländern darüber informiert, dass sie wohl ausspioniert wurden. Darunter sind Journalisten und Rechtsextreme.

publiziert am 5.5.2025
image

Ohne Google-Geld kein Firefox?

Wenn Google die Partnerschaft nicht weiterführen dürfte, könnte der Mozilla Foundation schnell das Geld ausgehen.

publiziert am 5.5.2025