White Paper:
Mit computergestützter Syntheseplanung die Chemie von morgen erschließen

Interview mit Professor Tim Cernak
Wir hatten das Privileg, ein Interview mit Prof. Tim Cernak zu führen, einem Assistenzprofessor für Medizinische Chemie an der Universität von Michigan, dessen vielfältige Forschungsinteressen chemische Synthese, Automatisierung, Datenwissenschaft und mehr umfassen. Mit mehr als einem Jahrzehnt Erfahrung steht Prof. Cernak an vorderster Front bei der Revolutionierung des Fachgebiets. In diesem Interview tauchen wir in die Welt der computergestützten Syntheseplanung (CASP) ein, einem Bereich, der Automatisierung, Computeranalyse und künstliche Intelligenz nutzt, um chemische Synthesen zu rationalisieren. Prof. Cernak spricht über die zentrale Rolle von CASP, die Entwicklung von regelbasierten Programmen zum maschinellen Lernen und die Synergie zwischen menschlichem Fachwissen und KI. Wir werden erforschen, wie neuronale Netze und von Experten kodierte Reaktionsregeln die Synthesegenauigkeit verbessern, und aktuelle Durchbrüche wie die nachhaltige Synthese aus Industrieabfällen diskutieren. Darüber hinaus werden wir das Potenzial der KI-gesteuerten organischen Synthese aufdecken und einen Ausblick auf die Zukunft wagen. Begleiten Sie uns in diesem aufschlussreichen Gespräch mit Prof. Tim Cernak auf unserer Reise durch die Bereiche CASP, Laborautomatisierung und die vielversprechende Zukunft der intelligenten Automatisierung in der synthetischen Chemie.

Prof. Timothy Cernak
Assistenzprofessor für Medizinische Chemie und Chemie
Tim Cernak wurde 1980 in Montreal, Kanada, geboren. Er erwarb einen B.Sc. in Chemie an der University of British Columbia Okanagan und studierte dort das Aromaprofil von Chardonnay-Weinen. Nach einer Doktorandenausbildung in Totalsynthese bei Prof. Jim Gleason an der McGill University war Tim FQRNT Postdoctoral Fellow bei Tristan Lambert an der Columbia University. Im Jahr 2009 trat Tim in das Team für Medizinische Chemie bei Merck Sharp & Dohme in Rahway, New Jersey, ein. Dort entwickelte er Technologien für miniaturisierte Synthese und späte Funktionalisierung. Im Jahr 2013 wechselte Tim zum Merck-Standort in Boston. 2018 wechselte Dr. Cernak als Assistenzprofessor an die Abteilung für Medizinische Chemie der University of Michigan in Ann Arbor. Das Cernak Lab erforscht eine Schnittstelle von chemischer Synthese und Datenwissenschaft. Tim Cernak ist Mitbegründer von Entos, Inc.
Welche Rolle spielt CASP auf dem Gebiet der computergestützten Syntheseplanung bei der Integration von menschlicher Intuition und rechnerischen Fähigkeiten?
Die computergestützte Syntheseplanung (CASP) ist ein schnell wachsendes Gebiet mit einer langen Geschichte. CASP-Systeme sollen Chemiker bei der Entscheidungsfindung unterstützen, indem sie Synthesewege vorschlagen, die bestimmte Kriterien wie Ausbeute, Kosten und Sicherheit erfüllen.
Vielleicht mehr als jedes andere Wissenschaftsgebiet umfasst und feiert die Totalsynthese die Kunst und Eleganz ihres Verfahrens. Das Gebiet destilliert jahrelange Entwicklungen in der strategischen Planung, Systeme mit entwickelter Logik und innovative und neuartige experimentelle Reaktivitätsmodi in eine Reihe von geplanten Reaktionsschritten. Der wachsende Korpus chemischer Reaktionen und die damit verbundenen Regeln und Mechanismen können von einem Menschen unmöglich auswendig gelernt werden. Interessanterweise folgen sie jedoch allen Regeln eines Spiels und können in einem Computer kodiert werden. Diese Logik kombiniert den menschlichen Entscheidungsprozess, das Expertenwissen und die chemische Intuition mit der Rechenleistung von Modellen und Algorithmen des maschinellen Lernens, um effiziente Syntheserouten zu generieren.
Können Sie die Entwicklung von regelbasierten Programmen zum maschinellen Lernen im Zusammenhang mit der computergestützten Analyse der Syntheseplanung erläutern?
Sicher, anfangs stützten sich regelbasierte Programme auf manuell kuratierte Sätze chemischer Reaktionen und funktioneller Gruppenumwandlungen, um synthetische Routen zu generieren. Diese Ansätze beinhalten eine manuelle Kuratierung der Reaktionsregeln, die zwar einen Kontext auf Expertenebene vermittelt, aber die Anzahl der in Frage kommenden Regeln einschränkt, insbesondere angesichts der Geschwindigkeit, mit der neue Reaktionsregeln in der Primärliteratur veröffentlicht werden. In jüngster Zeit haben sich Methoden des maschinellen Lernens (ML) als leistungsfähiges Werkzeug für die Planung chemischer Synthesen erwiesen, da sie große Datensätze chemischer Reaktionen einbeziehen können.
Welches sind die wichtigsten Meilensteine und Auswirkungen des Einsatzes von Algorithmen der künstlichen Intelligenz für den Vorschlag von Syntheserouten in der Kleinmolekülsynthese?
Moderne Synthesealgorithmen beginnen, über das Offensichtliche hinauszugehen und sich komplexeren Syntheseaufgaben zu stellen. Frühere CASD-Generationen konnten den Regeln der organischen Chemie folgen, aber die Antworten waren nicht allzu weit von den offensichtlichen Antworten entfernt. Mit der zunehmenden Zahl der verfügbaren Reaktionen, die in Betracht gezogen werden können, tauchen immer mehr neue Vorschläge auf. Die experimentelle Validierung computergeplanter Routen wird schließlich immer beliebter. Zu den wichtigsten Meilensteinen gehören die vollautomatische Ausführung auf Roboterplattformen, die Erzeugung komplexer natürlicher Produkte durch computergeplante Routen, die sich nicht von menschlich geplanten Routen unterscheiden lassen, und Partnerschaften zwischen Mensch und Computer, die zu außergewöhnlich kurzen Syntheserezepten für den Zugang zu natürlichen Produkten gelangt sind. Die fusionierten Hochdurchsatz-Experimentiertechniken sind ein aufregender neuer Bereich, der verspricht, den Prozess der Arzneimittelentdeckung weiter zu beschleunigen. Da immer mehr systematisch erfasste und maschinenlesbare Reaktionsdaten zur Verfügung stehen, werden sich die Vorhersagen durch maschinelles Lernen verbessern. In Zukunft werden wir wahrscheinlich noch mehr physikalisch basierte Vorhersagen sehen, die in Retrosyntheseberechnungen kodiert werden.
Welche Synergie gibt es zwischen Experten- und maschinellen Lernansätzen zur Verbesserung der retrosynthetischen Planung?
Bei der retrosynthetischen Planung geht es darum, optimale Syntheserouten für ein Zielmolekül zu ermitteln, indem man sich vom Zielmolekül zu einfacheren Ausgangsmaterialien zurückarbeitet. Um die Effektivität der retrosynthetischen Planung zu verbessern, können Ansätze von Experten und maschinellem Lernen (ML) gemeinsam eingesetzt werden.
Expertenansätze stützen sich auf das Wissen und die Erfahrung menschlicher Chemiker, um Schlüsselschritte in einer Synthese zu identifizieren. Diese Ansätze beruhen häufig auf einer Reihe von manuell kuratierten chemischen Regeln, die in jahrelanger Forschung entwickelt wurden. Obwohl diese Expertenansätze wertvoll sind, sind sie durch den Umfang und die Komplexität der Umwandlungen, die mit manuell kuratierten Regeln beschrieben werden können, begrenzt.
ML-Ansätze hingegen können große Datensätze bekannter chemischer Reaktionen analysieren und automatisch Muster und Umwandlungen lernen, die mit Expertenansätzen nur schwer oder gar nicht zu erfassen sind. Die Fähigkeit von ML-Algorithmen, diese neuen Muster und Umwandlungen zu erkennen, kann das Fachwissen und die Intuition von Chemikern ergänzen.
Die Synergie zwischen Experten- und ML-Ansätzen bei der retrosynthetischen Planung zeigt sich in der Entwicklung von expertengeleiteten ML-Algorithmen. Bei diesen Ansätzen wird das Expertenwissen genutzt, um die Auswahl potenzieller Syntheserouten, die von einem ML-Modell generiert werden, zu steuern. Dies ermöglicht eine höhere Genauigkeit und Spezifität bei der Auswahl von Syntheserouten, während gleichzeitig die Effizienz und der Umfang von ML-Algorithmen genutzt werden.
Insgesamt hat die Kombination von Experten- und ML-Ansätzen bei der retrosynthetischen Planung das Potenzial, die Geschwindigkeit und Effektivität dieses Prozesses erheblich zu verbessern, was zu einer effizienteren Arzneimittelforschung und letztlich zur Entwicklung neuer Therapien für Patienten führt.
Könnten Sie näher erläutern, wie neuronale Netze, die auf der Grundlage von expertenkodierten Reaktionsregeln trainiert wurden, zu einer höheren synthetischen Genauigkeit bei der retrosynthetischen Planung beitragen?
Neuronale Netze, die auf der Grundlage von expertenkodierten Reaktionsregeln trainiert werden, können die Genauigkeit der synthetischen Vorhersagen bei der retrosynthetischen Planung verbessern, indem sie detailliertes chemisches Wissen einbeziehen und gleichzeitig flexibel genug bleiben, um unvollständige oder neuartige Reaktionen zu berücksichtigen.
Expertenkodierte Reaktionsregeln sind eine Reihe von vordefinierten chemischen Regeln, die bekannte chemische Transformationen beschreiben. Diese Regeln beruhen auf jahrelanger Forschung und Fachwissen und können als Grundlage für das Training neuronaler Netze verwendet werden. Wenn neuronale Netze anhand dieser Regeln trainiert werden, können die Netze lernen, Reaktionsmuster zu erkennen und die Ergebnisse chemischer Umwandlungen besser vorherzusagen.
Der Einsatz neuronaler Netze, die anhand von durch Experten kodierten Reaktionsregeln trainiert werden, kann auch bei unvollständigen oder neuartigen Reaktionen helfen. Wenn beispielsweise eine chemische Umwandlung bisher nur in einer begrenzten Anzahl von Reaktionen beobachtet wurde, kann das neuronale Netz so trainiert werden, dass es das Ergebnis dieser Umwandlung auf der Grundlage der verfügbaren Daten und der Expertenregeln vorhersagt. Dies ist besonders nützlich im Zusammenhang mit der Entdeckung von Medikamenten, wo viele der Zielmoleküle noch nie zuvor synthetisiert wurden.
Durch die Einbeziehung detaillierter chemischer Kenntnisse in Form von expertenkodierten Regeln können neuronale Netze, die auf diese Regeln trainiert wurden, eine höhere Genauigkeit bei der retrosynthetischen Planung erreichen. Dies hilft Chemikern nicht nur, die Ergebnisse chemischer Reaktionen genauer vorherzusagen, sondern beschleunigt auch den Prozess der Arzneimittelentdeckung, indem es die Chemiker bei der Ermittlung optimaler Syntheserouten für neue Verbindungen unterstützt.
Wie kann man eine Bibliothek mit chemischen Reaktionen und Metadaten nutzen, um nachhaltige Synthesen zu entwerfen?
Dies ist ein wichtiger Aspekt künftiger Arbeiten. Das Schöne an der computergestützten Retrosynthese ist, dass man Protokolle, die ökologisch unsensible Reagenzien verwenden, z. B. Reaktionen, die Dichlormethan als Lösungsmittel erfordern oder bei denen eine große Menge an Metallabfällen anfällt, abwerten kann. Gleichzeitig können Sie Protokolle belohnen, die umweltfreundlichere Optionen nutzen.
Eine Möglichkeit, dies zu tun, besteht darin, Informationen über die Umweltauswirkungen bestimmter chemischer Reaktionen in die Bibliothek aufzunehmen. Eine Reihe von Faktoren wie die Menge des erzeugten Abfalls, die benötigte Energie und die Toxizität der Reagenzien können kodiert werden. Dies ermöglicht es Chemikern, nachhaltige Syntheserouten für Zielmoleküle zu identifizieren, indem sie Reaktionen aus der Bibliothek auswählen, die die erforderlichen Nachhaltigkeitskriterien erfüllen.
Über die Informationen zu den Umweltauswirkungen spezifischer chemischer Reaktionen hinaus können auch Metadaten über chemische Reaktionen verwendet werden, um nachhaltige Synthesen zu entwerfen. Diese Metadaten können Informationen wie die Reaktionsausbeute, die verwendeten Lösungsmittel und den Energiebedarf enthalten. Durch die Analyse dieser Metadaten können Chemiker effizientere und nachhaltigere Synthesewege identifizieren.
Durch die Nutzung einer Bibliothek mit chemischen Reaktionen und Metadaten zur Entwicklung nachhaltiger Synthesen können Chemiker die Umweltauswirkungen synthetischer Prozesse verringern und so zu einer nachhaltigeren und weniger verschwenderischen chemischen Industrie beitragen. Darüber hinaus können Chemiker durch die Auswahl von Reaktionen aus einer Bibliothek nachhaltiger Reaktionen auch die Geschwindigkeit und Kosteneffizienz des Arzneimittelentdeckungsprozesses verbessern, was zu besser zugänglichen und erschwinglicheren Behandlungen für Patienten führt.
Wie lassen sich KI-Algorithmen und Roboterplattformen im Zusammenhang mit der durch künstliche Intelligenz gesteuerten organischen Synthese miteinander verbinden?
Die Kopplung von KI-Algorithmen und Roboterplattformen in der durch künstliche Intelligenz gesteuerten organischen Synthese könnte die Geschwindigkeit und Effizienz des Entdeckungsprozesses erheblich verbessern. Bei der KI-gesteuerten organischen Synthese wird die Logik der Synthese automatisiert, während Roboterplattformen die praktische Laborarbeit automatisieren - eine leistungsstarke Kombination.
Mit Hilfe von KI-Algorithmen lassen sich die optimalen Syntheserouten für ein bestimmtes Zielmolekül vorhersagen, wobei umfangreiche Datenbanken mit chemischen Reaktionen und zugehörigen Daten genutzt werden können. Roboterplattformen können dann zur Synthese des Zielmoleküls auf der Grundlage der vorhergesagten Wege eingesetzt werden. Der Einsatz dieser Plattformen ermöglicht schnelle Experimente und die Hochdurchsatzsynthese einer großen Anzahl von Verbindungen.
Die Kombination von KI-Algorithmen und Roboterplattformen kann durch die Verwendung von Feedback-Mechanismen zur Optimierung des Syntheseprozesses in Echtzeit noch weiter verbessert werden. So könnte beispielsweise ein KI-Algorithmus den Syntheseprozess überwachen und Rückmeldungen zu den Reaktionsbedingungen geben, was zu einer weiteren Optimierung des Syntheseweges und letztlich zu besseren Ergebnissen führt.
Eine weitere Möglichkeit, wie KI-Algorithmen und mikrofluidische Roboterplattformen miteinander verbunden werden können, ist der Einsatz von Algorithmen des maschinellen Lernens zur Verbesserung der Leistung der mikrofluidischen Plattform. Durch kontinuierliche Überwachung und Rückmeldung können Algorithmen des maschinellen Lernens lernen, optimale Reaktionsbedingungen vorherzusagen und die Effizienz und Genauigkeit der mikrofluidischen Plattform zu verbessern.
Letztlich kann durch die Kombination von KI-Algorithmen und mikrofluidischen Roboterplattformen der Prozess der Arzneimittelentdeckung beschleunigt werden, was eine schnelle Identifizierung neuer Arzneimittelkandidaten ermöglicht. Dies hat das Potenzial, die Ergebnisse für die Patienten erheblich zu verbessern, indem schnellere und wirksamere Behandlungen für ein breites Spektrum von Krankheiten bereitgestellt werden.
Das Spannende daran ist, dass die Laborrobotik durch kommerzielle Anbieter oder demokratische Open-Source-Hardwareplattformen immer mehr für alle zugänglich wird. Die Entwicklung wird sich sicher noch beschleunigen, da die Laborautomatisierung in der Ausbildung von Studenten und Hochschulabsolventen eine immer größere Rolle spielt und die nächste Generation von Forschern auf diese Zukunft der Arbeit vorbereitet.
Wie hat die Laborautomatisierung die herkömmliche Synthese verändert, und welche Vorteile bietet sie gegenüber dem manuellen Betrieb?
Die Laborautomatisierung hat die herkömmliche Synthese verändert, indem sie Experimente mit hohem Durchsatz und eine schnellere, präzisere Synthese komplexer organischer Verbindungen ermöglicht. Zu den wichtigsten Vorteilen gegenüber dem manuellen Betrieb gehören eine höhere Effizienz, eine größere Präzision, eine bessere Reproduzierbarkeit, die Fähigkeit, mit gefährlichen Materialien umzugehen, und die Integration von künstlicher Intelligenz und maschinellen Lernalgorithmen.
Die Automatisierung ermöglicht die schnelle und reproduzierbare Synthese einer großen Anzahl von Verbindungen, wodurch sich der Zeit- und Arbeitsaufwand für chemische Routineaufgaben verringert und die Wissenschaftler sich auf komplexere Forschungsarbeiten konzentrieren können. Automatisierte Geräte können präzise Mengen an Reagenzien dosieren, was zu einer geringeren Variabilität der Reaktionsergebnisse und einer höheren Genauigkeit der Ergebnisse führt, und sie können gefährliche Materialien und Reaktionen sicher handhaben, was die Forscher vor potenziell schädlichen Chemikalien schützt.
Die Automatisierung gewährleistet, dass die Experimente unter einheitlichen Bedingungen durchgeführt werden, wodurch die Wahrscheinlichkeit menschlicher Fehler verringert und die Reproduzierbarkeit der Ergebnisse erhöht wird. Sie kann mit künstlicher Intelligenz und Algorithmen des maschinellen Lernens kombiniert werden, um den Laborbetrieb weiter zu optimieren und die Entwicklung neuer Verbindungen zu beschleunigen.
Insgesamt hat die Laborautomatisierung das Potenzial, die Effizienz und Präzision der herkömmlichen Synthese erheblich zu verbessern, was zu einer schnelleren Entdeckung von Medikamenten und letztlich zu wirksameren Behandlungen für Patienten führt.
Wie sieht die Zukunft der synthetischen Automatisierung aus, und wie stellen Sie sich den Übergang von arbeitsintensiven Prozessen zu intelligenter Automatisierung vor?
Die Zukunft der synthetischen Automatisierung wird voraussichtlich von weiteren Fortschritten in der Robotik, dem maschinellen Lernen und der künstlichen Intelligenz geprägt sein, die zu immer ausgefeilteren und intelligenteren Automatisierungssystemen führen.
Einer der Hauptschwerpunkte der zukünftigen synthetischen Automatisierung wird die Entwicklung autonomer Labore sein, die rund um die Uhr ohne menschliches Eingreifen arbeiten können. Diese Systeme werden mit Robotern und Algorithmen des maschinellen Lernens ausgestattet sein, die in der Lage sind, Routineaufgaben auszuführen, Experimente zu überwachen und auf der Grundlage der generierten Daten autonome Entscheidungen zu treffen.
Ein weiterer Schwerpunkt wird die weitere Integration der künstlichen Intelligenz in den Prozess der Arzneimittelforschung sein. Dazu gehört die Entwicklung von KI-Algorithmen, die in der Lage sind, riesige Mengen chemischer Daten zu analysieren, die Ergebnisse chemischer Reaktionen vorherzusagen und die Versuchsbedingungen in Echtzeit zu optimieren.
Es wird erwartet, dass die Automatisierung der Synthese im Laufe der Zeit immer intelligenter wird, wobei die Automatisierungssysteme immer komplexere Aufgaben übernehmen und neue Erkenntnisse liefern, die die Entdeckung von Medikamenten beschleunigen können. Diese hochautomatisierten Systeme werden es den Forschern ermöglichen, eine breite Palette von Experimenten mit minimalem Arbeitsaufwand und unter menschlicher Aufsicht durchzuführen, was zu einer schnelleren und effizienteren Arzneimittelentwicklung führt.
Insgesamt geht der Trend bei der synthetischen Automatisierung in Richtung intelligenter und hochentwickelter Systeme, die komplexe Experimente durchführen und schnell große Datenmengen erzeugen können, die zur weiteren Optimierung des Arzneimittelentdeckungsprozesses genutzt werden können. Für die Zukunft ist eine Entwicklung von arbeitsintensiven Prozessen hin zu hochautomatisierten, intelligenten Systemen zu erwarten, die die Arzneimittelforschung revolutionieren und zu neuen Therapien für eine Vielzahl von Krankheiten führen können.
In Anbetracht der Erkenntnisse aus diesen Beiträgen und der Fortschritte in der computergestützten Retrosynthese, wie wird Ihrer Meinung nach die fortgesetzte Integration von künstlicher Intelligenz und Automatisierung die Landschaft der chemischen Synthese in den kommenden Jahren prägen?
Die fortgesetzte Integration von künstlicher Intelligenz und Automatisierung wird die Landschaft der chemischen Synthese in Zukunft voraussichtlich dramatisch prägen. Es wird erwartet, dass KI und Automatisierung die Entdeckung von Arzneimitteln beschleunigen werden, indem sie es Chemikern ermöglichen, Verbindungen schneller und effizienter zu synthetisieren. Dies wird es den Forschern ermöglichen, eine größere Anzahl von Molekülen zu testen und ein breiteres Spektrum des chemischen Raums zu erforschen. Die Integration von künstlicher Intelligenz und Automatisierung kann auch dazu beitragen, die Umweltauswirkungen der chemischen Synthese zu verringern, indem Forscher in die Lage versetzt werden, nachhaltigere chemische Wege zu finden.
KI-Algorithmen mit automatisierter Synthese können zu einer Verringerung menschlicher Fehler führen und eine präzisere Synthese ermöglichen, wodurch qualitativ hochwertigere Produkte entstehen. Sie werden die Erforschung des chemischen Raums bei der Arzneimittelentdeckung beschleunigen und zur Identifizierung neuer Verbindungen führen, die mit herkömmlichen Methoden nur schwer zu entdecken wären. Die Integration von KI und Automatisierung in die chemische Synthese hat das Potenzial, das Feld grundlegend zu verändern, die Geschwindigkeit und Effizienz der Arzneimittelentdeckung erheblich zu beschleunigen und gleichzeitig unsere Fähigkeit zu verbessern, nachhaltige und wirksame Arzneimittelmoleküle zu identifizieren. Die Zukunft der chemischen Synthese sieht mit der weiteren Integration dieser Technologien rosig aus.
Offenlegung: Das Cernak Labor hat Forschungsmittel oder Sachspenden von MilliporeSigma, Burlington, MA, einer Tochtergesellschaft von Merck, Relay Therapeutics, Janssen Therapeutics, SPT Labtech und MSD Inc. erhalten. T.C. hält Anteile an Scorpion Therapeutics und ist Mitbegründer von und Anteilseigner an Iambic Therapeutics.