Das europäische Forschungsprojekt OpenGPT-X hat ein neues grosses KI-Sprachmodell (LLM) veröffentlicht. Das Modell mit dem Namen "Teuken-7B" wurde auf der Plattform Hugging Face zum Download bereitgestellt.
OpenGPT-X ist ein europäisches Forschungs- und Entwicklungsprojekt, das Anfang 2022 gestartet wurde. Ziel des Projekts ist die Entwicklung eines grossen KI-Sprachmodells, das den Anforderungen europäischer Werte, Datenschutzstandards und sprachlicher Vielfalt gerecht wird. "Teuken-7B" wurde von Grund auf mit den 24 Amtssprachen der EU trainiert und umfasst 7 Milliarden Parameter.
Gegen die US-Vormachtstellung bei KI-Sprachmodellen
Bislang stammen fast alle relevanten KI-Sprachmodelle der westlichen Welt aus den USA. Dazu gehören GPT-4 von OpenAI, Claude vom KI-Startup Anthropic, Llama vom Facebook-Konzern Meta oder Gemini von Google. Nach Schätzungen von Experten verfügt allein die GPT-Variante GPT-4o von OpenAI über rund 200 Milliarden Parameter.
Das europäische Modell "Teuken-7B" soll weltweit frei zur Verfügung stehen und damit eine aus der öffentlichen Forschung stammende Alternative für Wissenschaft und Unternehmen bieten können. Akteure aus Forschung und Unternehmen können das Open-Source-Modell auch in kommerziellen Projekten verwenden und den Code in ihren eigenen KI-Anwendungen nutzen.
Europäische Sprachvielfalt
Das Projekt OpenGPT-X wird von den beiden Fraunhofer-Instituten für Intelligente Analyse- und Informationssysteme (IAIS) und für Integrierte Schaltungen (IIS) geleitet. Beteiligt sind ausserdem die TU Dresden, das Forschungszentrum Jülich und Unternehmen wie Aleph Alpha und Ionos.
"Unser Modell hat seine Leistungsfähigkeit über eine grosse Bandbreite an Sprachen gezeigt, und wir hoffen, dass möglichst viele das Modell für eigene Arbeiten und Anwendungen adaptieren oder weiterentwickeln werden", sagte dazu Stefan Wrobel, Institutsleiter am Fraunhofer IAIS.
So wolle man sowohl innerhalb der wissenschaftlichen Community als auch gemeinsam mit Unternehmen unterschiedlicher Branchen einen Beitrag leisten, um den steigenden Bedarf nach transparenten und individuell anpassbaren Lösungen der generativen Künstlichen Intelligenz zu bedienen.