Meta und Mistral stellen neue LLMs vor

25. Juli 2024 um 12:36
image
Foto: Ýlona María Rybka / Unsplash

Die Unternehmen haben neue Large Language Models präsentiert. Dabei behaupten beide, dass ihre Modelle mit den führenden auf dem Markt mithalten können.

Meta hat sein neuestes grosses Sprachmodell (LLM) mit dem Namen Llama 3.1 405B veröffentlicht. Nach Angaben der Muttergesellschaft von Facebook ist das neue Modell das weltweit grösste Open-Source-LLM. Es baut auf seinem Vorgänger auf und soll auch dabei helfen, kleinere Modelle zu trainieren. Neben der Einführung von Llama 3.1 405B hat Meta auch aktualisierte Versionen der Modelle Llama 8B und Llama 70B herausgebracht.
Bei Llama 3.1 405B wurde nach Angaben von Meta die Kontextlänge auf 128K erweitert und die Unterstützung für acht Sprachen hinzugefügt. Dazu zählen neben Englisch auch Französisch, Deutsch, Hindi, Italienisch, Portugiesisch, Spanisch und Thai. Das neueste Modell soll zudem auch erweiterte Anwendungsfälle unterstützen, darunter die Zusammenfassung langer Texte oder ein Code-Assistenten.
Mark Zuckerberg, Gründer und CEO von Meta, sagte, dass das neueste Modell bereits mehreren seiner Konkurrenten voraus sei. "Wir gehen davon aus, dass die künftigen Llama-Modelle ab dem nächsten Jahr die fortschrittlichsten in der Branche sein werden", wird Zuckerberg von 'Techmonitor' zitiert.

Large 2 von Mistral veröffentlicht

Neben Meta hat auch das französische KI-Startup Mistral ein neues Large Language Model präsentiert. Large 2 soll nach Angaben des Unternehmens in Bezug auf Codegenerierung, Mathematik und Argumentation mit den neuesten Spitzenmodellen von OpenAI und Meta mithalten können.
In einer Mitteilung schreibt Mistral, dass eines der Hauptaugenmerke beim Training darauf lag, die Halluzinationsprobleme des Modells zu minimieren. Das Unternehmen sagte, dass Large 2 darauf trainiert wurde, differenziertere Antworten zu geben und zu erkennen, wenn es etwas nicht weiss, anstatt etwas zu erfinden, das plausibel erscheint.
Im Gegensatz zu den LLMs von Meta kommt das neuste Model von Mistral aber nicht als Open Source daher.

Loading

Mehr erfahren

Mehr zum Thema

image

Scandit übernimmt polnisches Startup Marketlab

Der Schweizer Anbieter von Smart-Data-Capture-Lösungen sichert sich mit der Übernahme neue Kompetenzen. Ein Expertenteam von Marketlab wechselt zu Scandit.

publiziert am 21.8.2024
image

Grössere Informatik-Panne bei den SBB

Die Anzeigen in den Bahnhöfen sind ausgefallen und auch beim Ticketkauf in der App und auf der Webseite gab es Probleme. Grund dafür war eine Netzwerkstörung.

aktualisiert am 20.8.2024
image

Solarwinds behebt kritische Sicherheitslücke

Eine Schwachstelle in der Helpdesk-Lösung von Solarwinds erlaubt Cyberkriminellen die Ausführung von Remote Code. Das Unter­nehmen ruft zum Patchen auf.

publiziert am 20.8.2024
image

Thurgauer Technologie-Forscher erhält Auszeichnung

Tobias Mettler beschäftigt sich mit der Adaption von neuen Technologien. Für seine Forschung zur vernetzten Arbeitsplatzüberwachung wurde er mit dem Forschungspreis Walter Enggist ausgezeichnet.

publiziert am 19.8.2024