Forscherinnen und Forscher der EPFL Lausanne haben ChatGPT für die chemische Forschung aufgepeppt. "Das wird die Art und Weise, wie wir Chemie betreiben, verändern", sagt EPFL-Forscher Berend Smit in einer Mitteilung der Hochschule. Zusammen mit seinem Team hat er das Sprachmodell GPT-3, das die Grundlage für den Chatbot ChatGPT bildet, mit einer Art Fragebogen ausgetrickst.
Wie das genau funktioniert, zeigen die Forschenden in einer Studie, die in der Fachzeitschrift
'Nature Machine Intelligence' veröffentlicht wurde. In seiner normalen Form taugt GPT-3 nicht für die chemische Forschung, wie Smit erklärt. Es kennt einen grossen Teil der wissenschaftlichen Literatur zur Chemie nicht. Wenn man ihm Fragen stellt, sind die Antworten in der Regel auf das beschränkt, was man auf Wikipedia finden kann.
95% Trefferquote
Die Forschenden der EPFL fügten dem Sprachmodell deshalb einen kleinen Datensatz an. Dies, indem sie der KI die Daten als eine Art Fragebogen mit Antworten fütterten. "Bei Legierungen mit hoher Entropie ist es zum Beispiel wichtig zu wissen, ob eine Legierung eine oder mehrere Phasen hat", erklärt Smit in der Mitteilung.
Um GPT-3 diese Information beizubringen, stellten sie also die Frage, "Besteht die <Name der Hochentropie-Legierung> aus einer einzigen Phase?", gefolgt von der Antwort Ja oder Nein. Während der Tests beantwortete das trainierte KI-Modell über 95% der unterschiedlichsten chemischen Probleme richtig. Damit übertraf es die Genauigkeit anderer hochmoderner KI-Modelle und war gleichzeitig auch schneller.
Herkömmliche Modelle für maschinelles Lernen erfordern monatelange Entwicklungsarbeiten und umfangreiche Kenntnisse. Im Gegensatz dazu dauert der neue Ansatz der EPFL nur fünf Minuten, wie die Hochschule in ihrer Mitteilung schreibt. In Zukunft könnten die KI-Modelle so zum Start eines Forschungsprojekts konsultiert werden, um das kollektive Wissen, das darin programmiert ist, zu nutzen.