Es wurden viele Versuche unternommen, die Leistungsfähigkeit künstlicher Intelligenz (KI) und großer Sprachmodelle (LLMs) zu nutzen, um die Ergebnisse neuer chemischer Reaktionen vorherzusagen. Der Erfolg war jedoch begrenzt, vor allem weil diese Modelle nicht an grundlegende physikalische Prinzipien wie das Gesetz der Massenerhaltung gebunden sind.
Nun hat ein Team am MIT einen Weg gefunden, physikalische Einschränkungen in Reaktionsvorhersagemodelle zu integrieren und so die Genauigkeit und Zuverlässigkeit der Ergebnisse deutlich zu verbessern.

Die am 20. August in der Zeitschrift Nature veröffentlichte Arbeit wurde gemeinsam von Joonyoung Joung (jetzt Assistenzprofessor an der Kookmin University, Südkorea), dem ehemaligen Softwareentwickler Mun Hong Fong (jetzt an der Duke University), dem Chemieingenieurwesen-Studenten Nicholas Casetti, dem Postdoktoranden Jordan Liles, dem Physikstudenten Ne Dassanayake und dem Hauptautor Connor Coley verfasst, der 1957 Professor für Karriereentwicklung in der Abteilung für Chemieingenieurwesen und der Abteilung für Elektrowissenschaft und -technik war.
Warum ist die Reaktionsvorhersage wichtig?
„Den Ausgang einer Reaktion vorherzusagen, ist eine sehr wichtige Aufgabe“, erklärt Joung. Wenn man beispielsweise ein neues Medikament herstellen möchte, „muss man wissen, wie man es synthetisiert. Dazu muss man wissen, welche Produkte wahrscheinlich aus einer Reihe von Ausgangsstoffen entstehen werden.“
Bei früheren Versuchen wurden häufig nur die Eingabe- und Ausgabedaten betrachtet und Zwischenschritte sowie physikalische Einschränkungen, wie etwa die Unfähigkeit, auf natürliche Weise Masse zu erzeugen oder zu verlieren, ignoriert.
Joung weist darauf hin, dass LLMs wie ChatGPT zwar einige Forschungserfolge erzielt haben, ihnen jedoch ein Mechanismus fehlt, der sicherstellt, dass ihre Ergebnisse den Gesetzen der Physik entsprechen. „Ohne die Erhaltung der ‚Token‘ (die Atome repräsentieren) werden LLMs in der Reaktion willkürlich Atome erzeugen oder zerstören“, sagt er. „Das ähnelt eher Alchemie als Wissenschaft.“
FlowerER-Lösung: Basierend auf alter Plattform, angewendet auf neue Technologie
Um dieses Problem zu lösen, verwendete das Team eine in den 1970er Jahren vom Chemiker Ivar Ugi entwickelte Methode – die Bindungselektronenmatrix – um Elektronen in einer Reaktion darzustellen.
Darauf aufbauend entwickelten sie das Programm FlowER (Flow matching for Electron Redistribution), das eine detaillierte Verfolgung der Elektronenbewegung ermöglicht und sicherstellt, dass keine Elektronen künstlich hinzugefügt werden oder verloren gehen.
Diese Matrix verwendet einen von Null verschiedenen Wert, um eine Bindung oder ein Paar freier Elektronen darzustellen, und Null für das Gegenteil. „Dadurch können wir sowohl das Atom als auch das Elektron erhalten“, erklärt Fong. Dies ist der Schlüssel zur Integration der Massenerhaltung in das Modell.
Frühe, aber vielversprechende Beweise
Laut Coley handelt es sich bei dem aktuellen System lediglich um eine Demonstration – einen Proof of Concept, der zeigt, dass sich die „Flow Matching“-Methode gut zur Vorhersage chemischer Reaktionen eignet.
Obwohl die Datenbank mit Daten aus über einer Million chemischer Reaktionen (gesammelt vom US-Patentamt) trainiert wurde, fehlen ihr noch immer metall- und katalytisch basierte Reaktionen.
„Wir sind begeistert, dass das System den Reaktionsmechanismus zuverlässig vorhersagen kann“, sagte Coley. „Es erhält Masse und Elektronen, aber es gibt sicherlich Möglichkeiten, die Robustheit in den kommenden Jahren zu erweitern und zu verbessern.“
Das Modell ist nun öffentlich auf GitHub verfügbar. Coley hofft, dass es ein nützliches Werkzeug zur Bewertung der Reaktivität und zur Erstellung von Reaktionskarten sein wird.
Offene Datenquellen und breites Anwendungspotenzial
„Wir haben alles veröffentlicht – vom Modell über die Daten bis hin zu einem zuvor von Joung erstellten Datensatz, der die bekannten mechanistischen Schritte der Reaktion detailliert beschreibt“, sagte Fong.
Laut dem Team kann FlowER bestehende Methoden bei der Entdeckung von Standardmechanismen erreichen oder sogar übertreffen und gleichzeitig auf bisher unbekannte Reaktionsklassen übertragen. Mögliche Anwendungen reichen von der pharmazeutischen Chemie über die Materialforschung , Brandforschung und Atmosphärenchemie bis hin zu elektrochemischen Systemen.
Im Vergleich zu anderen Systemen stellt Coley fest: „Mit der von uns gewählten Architektur erreichen wir einen Quantensprung in Bezug auf Gültigkeit und Integrität, während die Genauigkeit erhalten bleibt oder leicht verbessert wird.“
Das Besondere daran, so Coley, sei, dass das Modell keine Mechanismen „erfindet“, sondern sie anhand experimenteller Daten aus der Patentliteratur ableitet. „Wir extrahieren Mechanismen aus experimentellen Daten – etwas, das in diesem Umfang noch nie zuvor getan und geteilt wurde.“
Nächster Schritt
Das Team plant, das Verständnis des Modells für Metalle und Katalyse zu erweitern. „Wir haben erst an der Oberfläche gekratzt“, gibt Coley zu.
Langfristig glaubt er, dass das System dazu beitragen könnte, neue komplexe Reaktionen zu entdecken und bisher unbekannte Mechanismen aufzuklären. „Das langfristige Potenzial ist enorm, aber dies ist erst der Anfang.“
Die Forschung wurde vom Konsortium „Machine Learning for Pharmaceutical Discovery and Synthesis“ und der US-amerikanischen National Science Foundation (NSF) unterstützt.
(Quelle: MIT)
Quelle: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html
Kommentar (0)