Meta und Mistral stellen neue LLMs vor

25. Juli 2024 um 12:36
image
Foto: Ýlona María Rybka / Unsplash

Die Unternehmen haben neue Large Language Models präsentiert. Dabei behaupten beide, dass ihre Modelle mit den führenden auf dem Markt mithalten können.

Meta hat sein neuestes grosses Sprachmodell (LLM) mit dem Namen Llama 3.1 405B veröffentlicht. Nach Angaben der Muttergesellschaft von Facebook ist das neue Modell das weltweit grösste Open-Source-LLM. Es baut auf seinem Vorgänger auf und soll auch dabei helfen, kleinere Modelle zu trainieren. Neben der Einführung von Llama 3.1 405B hat Meta auch aktualisierte Versionen der Modelle Llama 8B und Llama 70B herausgebracht.
Bei Llama 3.1 405B wurde nach Angaben von Meta die Kontextlänge auf 128K erweitert und die Unterstützung für acht Sprachen hinzugefügt. Dazu zählen neben Englisch auch Französisch, Deutsch, Hindi, Italienisch, Portugiesisch, Spanisch und Thai. Das neueste Modell soll zudem auch erweiterte Anwendungsfälle unterstützen, darunter die Zusammenfassung langer Texte oder ein Code-Assistenten.
Mark Zuckerberg, Gründer und CEO von Meta, sagte, dass das neueste Modell bereits mehreren seiner Konkurrenten voraus sei. "Wir gehen davon aus, dass die künftigen Llama-Modelle ab dem nächsten Jahr die fortschrittlichsten in der Branche sein werden", wird Zuckerberg von 'Techmonitor' zitiert.

Large 2 von Mistral veröffentlicht

Neben Meta hat auch das französische KI-Startup Mistral ein neues Large Language Model präsentiert. Large 2 soll nach Angaben des Unternehmens in Bezug auf Codegenerierung, Mathematik und Argumentation mit den neuesten Spitzenmodellen von OpenAI und Meta mithalten können.
In einer Mitteilung schreibt Mistral, dass eines der Hauptaugenmerke beim Training darauf lag, die Halluzinationsprobleme des Modells zu minimieren. Das Unternehmen sagte, dass Large 2 darauf trainiert wurde, differenziertere Antworten zu geben und zu erkennen, wenn es etwas nicht weiss, anstatt etwas zu erfinden, das plausibel erscheint.
Im Gegensatz zu den LLMs von Meta kommt das neuste Model von Mistral aber nicht als Open Source daher.

Loading

Mehr zum Thema

image

Google enttäuscht mit Geschäftszahlen und KI-Grundsätzen

Der US-Konzern muss seine lukrative Suche gegen KI-Konkurrenz verteidigen und investiert deshalb Milliarden in Infrastruktur. Gleichzeitig gibt Google ein altes Versprechen auf.

publiziert am 5.2.2025
image

Bechtle meldet "versöhnlichen" Jahresabschluss

Im letzten Quartal hätten sich die Geschäfte belebt, sagt der IT-Dienstleistungs- und -Handelskonzern.

publiziert am 5.2.2025
image

Wie die aktuellen humanoiden Roboter aussehen

Sie heissen Phoenix, Atlas oder H1 und kommen aus den USA, Kanada und China. Eine Visualisierung der derzeitigen Roboter-Generationen.

publiziert am 5.2.2025
image

Europäer wollen eigenes OpeneuroLLM entwickeln

Eigene europäische KI-Modelle sollen die EU-Gesetze respektieren und sich für Firmen und Behörden adaptieren lassen. Ihre Mehrsprachigkeit spiegelt die kulturellen Eigenheiten wider.

publiziert am 4.2.2025