Livre blanc :
Déverrouiller la chimie de demain grâce à la planification de la synthèse assistée par ordinateur

Entretien avec le professeur Tim Cernak
Nous avons eu le privilège d'interviewer le professeur Tim Cernak, professeur adjoint de chimie médicinale à l'Université du Michigan, dont les divers intérêts de recherche couvrent la synthèse chimique, l'automatisation, la science des données, et bien plus encore. Avec plus d'une décennie d'expérience, le professeur Cernak a été à l'avant-garde de la révolution dans ce domaine. Dans cet entretien, nous nous plongeons dans le monde de la Planification de la synthèse chimique assistée par ordinateur (CASP), un domaine qui tire parti de l'automatisation, de l'analyse computationnelle et de l'intelligence artificielle pour rationaliser les synthèses chimiques. Le professeur Cernak évoquera le rôle central du CASP, l'évolution des programmes basés sur des règles vers l'apprentissage automatique et la synergie entre l'expertise humaine et l'IA. Nous étudierons comment les réseaux neuronaux et les Règles codées par des experts améliorent la précision de la synthèse et nous discuterons de percées récentes telles que la synthèse durable à partir de déchets industriels. En outre, nous découvrirons le potentiel de la synthèse organique pilotée par l'IA et explorerons les perspectives d'avenir. Rejoignez-nous dans cette conversation éclairante avec le professeur Tim Cernak pour un voyage à travers les domaines du CASP, de l'automatisation des laboratoires et de l'avenir prometteur de l'automatisation intelligente dans la chimie de synthèse.

Timothy Cernak
Professeur adjoint de chimie médicinale et de chimie
Tim Cernak est né à Montréal, au Canada, en 1980. Il a obtenu une licence en chimie à l'Université de Colombie-Britannique Okanagan, où il a étudié le profil aromatique des vins Chardonnay. Après une formation doctorale en synthèse totale avec le professeur Jim Gleason à l'Université McGill, Tim a été boursier postdoctoral du FQRNT avec Tristan Lambert à l'Université Columbia. En 2009, Tim a rejoint l'équipe de chimie médicinale de Merck Sharp & Dohme à Rahway, dans le New Jersey. Il y a développé des technologies pour la synthèse miniaturisée et la fonctionnalisation à un stade avancé. En 2013, Tim a rejoint le site de Merck à Boston. En 2018, le Dr Cernak a rejoint le département de chimie médicinale de l'Université du Michigan à Ann Arbor en tant que professeur adjoint. Le laboratoire Cernak explore une interface de la synthèse chimique et de la science des données. Tim est cofondateur d'Entos, Inc.
Dans le domaine de la planification de la synthèse assistée par ordinateur, quel rôle joue le CASP dans l'intégration de l'intuition humaine et des capacités informatiques ?
La planification de la synthèse assistée par ordinateur (CASP) est un domaine en plein essor dont l'histoire est riche. Les systèmes CASP sont conçus pour aider les chimistes à prendre des décisions en suggérant des Voies de synthèse qui répondent à des critères spécifiques tels que le rendement, le coût et la sécurité.
Peut-être plus que tout autre domaine scientifique, la synthèse totale embrasse et célèbre l'art et l'élégance de son processus. Le domaine distille des années de développement en matière de planification stratégique, de systèmes de logique développée et de modes de réactivité expérimentale innovants et nouveaux dans une série d'étapes de réaction planifiées. Le corpus croissant de réactions chimiques, ainsi que les règles et mécanismes qui y sont associés, ne peuvent être mémorisés par un être humain. Il est toutefois intéressant de noter qu'elles suivent toutes les règles d'un jeu et qu'elles peuvent être encodées dans un ordinateur. Cette logique combine le processus décisionnel humain, les connaissances des experts et l'intuition chimique avec la puissance de calcul des modèles et algorithmes d'apprentissage automatique pour générer des Voies de synthèse efficaces.
Pouvez-vous mettre en évidence la progression des programmes basés sur des règles vers l'apprentissage automatique dans le contexte de l'analyse computationnelle de la planification synthétique ?
Bien sûr, au début, les programmes basés sur des règles s'appuyaient sur des ensembles de réactions chimiques et de transformations de groupes fonctionnels curés manuellement pour générer des Voies de synthèse. Ces approches impliquent une curation manuelle des règles de réaction, ce qui confère un contexte de niveau expert mais limite le nombre de règles qui peuvent être prises en compte, en particulier au rythme où de nouvelles règles de réaction sont rapportées dans la littérature primaire. Plus récemment, les méthodes d'apprentissage automatique sont apparues comme un outil puissant pour la planification de la synthèse chimique, car elles peuvent intégrer de vastes ensembles de données de réactions chimiques.
Quelles sont les étapes importantes et les implications de l'utilisation d'algorithmes d'intelligence artificielle pour proposer des Voies de synthèse dans la synthèse de petites molécules ?
Les algorithmes de synthèse modernes commencent à aller au-delà de ce qui est évident et à relever des défis de synthèse plus complexes. Les générations précédentes de CASD pouvaient suivre les règles de la chimie organique, mais les réponses n'étaient pas très éloignées des réponses évidentes. Au fur et à mesure que le corpus de réactions disponibles à prendre en compte s'est élargi, des suggestions plus novatrices commencent à apparaître. La validation expérimentale des itinéraires planifiés par ordinateur devient enfin plus populaire avec quelques étapes clés, notamment l'exécution entièrement automatisée sur des plateformes robotiques, la génération de produits naturels complexes par des itinéraires planifiés par ordinateur qui ne se distinguent pas des itinéraires planifiés par l'homme, et des partenariats homme-ordinateur qui sont parvenus à des recettes de synthèse exceptionnellement brèves pour accéder à des produits naturels. Les techniques d'expérimentation à haut débit constituent un nouveau domaine passionnant qui promet d'accélérer encore le processus de découverte de médicaments. Au fur et à mesure que des données de réaction systématiquement saisies et lisibles par machine deviennent disponibles, les prédictions de l'apprentissage automatique s'amélioreront. À l'avenir, nous verrons probablement encore plus de prédictions basées sur la physique encodées dans les calculs de rétrosynthèse.
Quelle est la synergie entre les approches d'experts et d'apprentissage automatique pour améliorer la planification rétrosynthétique ?
Dans la planification rétrosynthétique, l'objectif est d'identifier les Voies de synthèse optimales pour une molécule cible en travaillant à rebours à partir de la molécule cible vers des matériaux de départ plus simples. Les approches expertes et d'apprentissage automatique peuvent être utilisées conjointement pour améliorer l'efficacité de la planification rétrosynthétique.
Les approches expertes s'appuient sur les connaissances et l'expérience des chimistes humains pour identifier les étapes clés d'une synthèse. Ces approches sont souvent basées sur un ensemble de règles chimiques curatées manuellement qui ont été développées au cours d'années de recherche. Bien que ces approches expertes soient précieuses, elles sont limitées par la portée et la complexité des transformations qui peuvent être décrites à l'aide de règles élaborées manuellement.
Les approches ML, en revanche, peuvent analyser de grands ensembles de données de réactions chimiques connues et apprendre automatiquement des modèles et des transformations qui sont difficiles ou impossibles à saisir à l'aide d'approches expertes. La capacité des algorithmes de ML à identifier ces nouveaux modèles et transformations peut augmenter la connaissance du domaine et l'intuition des chimistes humains.
La synergie entre les approches d'experts et de ML dans la planification rétrosynthétique peut être observée dans le développement d'algorithmes de ML guidés par des experts. Dans ces approches, les connaissances des experts sont utilisées pour guider la sélection des Voies de synthèse potentielles générées par un modèle ML. Cela permet d'accroître la précision et la spécificité dans la sélection des Voies de synthèse, tout en bénéficiant de l'efficacité et de l'échelle des algorithmes de ML.
Dans l'ensemble, la combinaison d'approches expertes et de ML dans la planification rétrosynthétique a le potentiel d'améliorer considérablement la vitesse et l'efficacité de ce processus, conduisant à une découverte de médicaments plus efficace et, en fin de compte, au développement de nouvelles thérapies pour les patients.
Pourriez-vous préciser comment les réseaux neuronaux formés sur des Règles codées par des experts contribuent à atteindre une plus grande précision synthétique dans la planification rétrosynthétique ?
Les réseaux neuronaux entraînés sur des Règles codées par des experts peuvent améliorer la précision des prédictions synthétiques dans la planification rétrosynthétique en intégrant des connaissances chimiques détaillées tout en restant suffisamment flexibles pour prendre en compte des réactions incomplètes ou nouvelles.
Les règles codées par des experts sont un ensemble de règles chimiques prédéfinies qui décrivent des transformations chimiques connues. Ces règles sont basées sur des années de recherche et de connaissance du domaine et peuvent être utilisées comme base pour l'entraînement des réseaux neuronaux. En entraînant les réseaux neuronaux sur ces règles, les réseaux peuvent apprendre à reconnaître des modèles de réactions et à mieux prédire les résultats des transformations chimiques.
L'utilisation de réseaux neuronaux formés sur des Règles codées par des experts peut également aider à relever le défi des réactions incomplètes ou nouvelles. Par exemple, si une transformation chimique n'a été observée auparavant que dans un ensemble limité de réactions, le réseau neuronal peut être entraîné à prédire le résultat de cette transformation sur la base des données disponibles et des règles d'expert. Ceci est particulièrement utile dans le contexte de la découverte de médicaments, où de nombreuses molécules cibles n'ont jamais été synthétisées auparavant.
En incorporant des connaissances chimiques détaillées sous la forme de règles codées par des experts, les réseaux neuronaux entraînés sur ces règles peuvent atteindre une plus grande précision dans la planification rétrosynthétique. Cela permet non seulement aux chimistes de prédire plus précisément les résultats des réactions chimiques, mais aussi d'accélérer le processus de découverte de médicaments en aidant les chimistes à identifier les voies de synthèse optimales pour les nouveaux composés.
Comment tirer parti d'une bibliothèque de réactions chimiques et de métadonnées pour concevoir des synthèses durables ?
Il s'agit là d'un aspect important des travaux futurs. La beauté de la rétrosynthèse computationnelle réside dans le fait que l'on peut démériter les protocoles qui utilisent des réactifs insensibles à l'écologie, par exemple les réactions nécessitant du dichlorométhane comme solvant ou produisant une grande quantité de déchets métalliques. En revanche, vous pouvez récompenser les protocoles qui utilisent des options plus respectueuses de l'environnement.
L'un des moyens d'y parvenir consiste à incorporer dans la bibliothèque des informations sur l'impact environnemental de réactions chimiques spécifiques. Divers facteurs tels que la quantité de déchets générés, l'énergie requise et la toxicité des réactifs peuvent être encodés. Cela permet aux chimistes d'identifier des Voies de synthèse durables pour des molécules cibles, en sélectionnant des réactions dans la bibliothèque qui répondent aux critères de durabilité requis.
À propos de l'impact environnemental de réactions chimiques spécifiques, les métadonnées sur les réactions chimiques peuvent également être utilisées pour concevoir des synthèses durables. Ces métadonnées peuvent inclure des informations telles que les rendements des réactions, les solvants utilisés et les besoins en énergie. En analysant ces métadonnées, les chimistes peuvent identifier des Voies de synthèse plus efficaces et plus durables.
En exploitant une bibliothèque de réactions chimiques et de métadonnées pour concevoir des synthèses durables, les chimistes peuvent réduire l'impact environnemental des processus de synthèse, ce qui conduit à une industrie chimique plus durable et moins génératrice de déchets. En outre, en sélectionnant des réactions dans une bibliothèque de réactions durables, les chimistes peuvent également améliorer la vitesse et la rentabilité du processus de découverte de médicaments, conduisant à des traitements plus accessibles et abordables pour les patients.
Dans le contexte de la synthèse organique pilotée par l'intelligence artificielle, comment peut-on coupler les algorithmes d'IA et les plateformes robotiques ?
Le couplage des algorithmes d'IA et des plateformes robotiques dans le cadre de la synthèse organique pilotée par l'intelligence artificielle pourrait améliorer considérablement la vitesse et l'efficacité du processus de découverte. La synthèse organique pilotée par l'IA automatise la logique de la synthèse, tandis que les plates-formes robotiques automatisent le travail pratique en laboratoire ; il s'agit donc d'une combinaison puissante.
Les algorithmes d'IA peuvent être utilisés pour prédire les Voies de synthèse optimales pour une molécule cible donnée, en exploitant de vastes bases de données de réactions chimiques et de données connexes. Des plateformes robotiques peuvent ensuite être utilisées pour synthétiser la molécule cible sur la base des itinéraires prédits. L'utilisation de ces plateformes permet une expérimentation rapide et la synthèse à haut débit d'un grand nombre de composés.
La combinaison d'algorithmes d'IA et de plateformes robotisées peut être encore améliorée en utilisant des mécanismes de boucle de rétroaction pour optimiser le processus de synthèse en temps réel. Par exemple, un algorithme d'IA pourrait surveiller le processus de synthèse et fournir un retour d'information sur les conditions de réaction, ce qui permettrait d'optimiser davantage la voie de synthèse et, en fin de compte, d'obtenir de meilleurs résultats.
Une autre façon de coupler les algorithmes d'IA et les plateformes microfluidiques robotisées consiste à utiliser des algorithmes d'apprentissage automatique pour améliorer les performances de la plateforme microfluidique. Grâce à une surveillance et à une rétroaction continues, les algorithmes d'apprentissage automatique peuvent apprendre à prédire les conditions de réaction optimales et à améliorer l'efficacité et la précision de la plateforme microfluidique.
En fin de compte, en combinant la puissance des algorithmes d'IA et des plateformes microfluidiques robotisées, le processus de découverte de médicaments peut être accéléré, ce qui permet d'identifier rapidement de nouveaux candidats médicaments. Cela pourrait améliorer considérablement les résultats pour les patients en fournissant des traitements plus rapides et plus efficaces pour un large éventail de maladies.
Ce qui est passionnant, c'est que la robotique de laboratoire devient de plus en plus accessible à tous, par l'intermédiaire de fournisseurs commerciaux ou de plates-formes matérielles démocratisées à source ouverte. Le domaine va certainement s'accélérer encore davantage, car l'automatisation des laboratoires joue un rôle croissant dans l'enseignement des programmes de premier et deuxième cycles, préparant la prochaine génération de chercheurs à cet avenir du travail.
Comment l'automatisation des laboratoires a-t-elle transformé la synthèse traditionnelle et quels sont les principaux avantages qu'elle offre par rapport aux opérations manuelles ?
L'automatisation des laboratoires a transformé la synthèse traditionnelle en permettant des expériences à haut débit et une synthèse plus rapide et plus précise de composés organiques complexes. Parmi les principaux avantages qu'elle offre par rapport aux opérations manuelles, citons une efficacité accrue, une plus grande précision, une meilleure reproductibilité, la capacité de manipuler des matières dangereuses et l'intégration avec des algorithmes d'intelligence artificielle et d'apprentissage automatique.
L'automatisation permet la synthèse rapide et reproductible d'un grand nombre de composés, ce qui réduit le temps et les efforts requis pour les tâches chimiques de routine et libère les scientifiques pour qu'ils se concentrent sur des recherches plus complexes. Les équipements automatisés peuvent distribuer des volumes précis de réactifs, ce qui entraîne une moindre variabilité dans les résultats des réactions et une meilleure précision des résultats, et peuvent manipuler des matériaux et des réactions dangereux en toute sécurité, protégeant ainsi les chercheurs de produits chimiques potentiellement nocifs.
L'automatisation garantit que les expériences sont réalisées dans des conditions cohérentes, ce qui réduit la probabilité d'une erreur humaine et augmente la reproductibilité des résultats. Elle peut être intégrée à des algorithmes d'intelligence artificielle et d'apprentissage automatique afin d'optimiser davantage les opérations de laboratoire et d'accélérer le développement de nouveaux composés.
Dans l'ensemble, l'automatisation des laboratoires a le potentiel d'améliorer considérablement l'efficacité et la précision de la synthèse traditionnelle, ce qui permettra d'accélérer la découverte de médicaments et, en fin de compte, d'offrir des traitements plus efficaces aux patients.
Quelles sont les perspectives d'avenir de l'automatisation synthétique et comment envisagez-vous la progression des processus à forte intensité de main-d'œuvre vers l'automatisation intelligente ?
L'avenir de l'automatisation synthétique devrait être marqué par des progrès continus dans les domaines de la robotique, de l'apprentissage automatique et de l'intelligence artificielle, conduisant à des systèmes d'automatisation de plus en plus sophistiqués et intelligents.
L'un des principaux domaines d'intérêt de l'automatisation synthétique future sera le développement de laboratoires autonomes pouvant fonctionner 24 heures sur 24, 7 jours sur 7, sans intervention humaine. Ces systèmes seront équipés d'algorithmes de robotique et d'apprentissage automatique capables d'effectuer des tâches de routine, de surveiller les expériences et de prendre des décisions autonomes sur la base des données générées.
Un autre domaine d'intérêt sera l'intégration plus poussée de l'intelligence artificielle dans le processus de découverte de médicaments. Cela impliquera le développement d'algorithmes d'IA capables d'analyser de grandes quantités de données chimiques, de prédire les résultats des réactions chimiques et d'optimiser les conditions expérimentales en temps réel.
Au fil du temps, on s'attend à ce que l'automatisation synthétique devienne de plus en plus intelligente, les systèmes d'automatisation prenant en charge des tâches de plus en plus complexes et générant de nouvelles connaissances susceptibles d'accélérer la découverte de médicaments. Ces systèmes hautement automatisés permettront aux chercheurs d'effectuer un large éventail d'expériences avec un minimum de travail et de surveillance humaine, ce qui conduira à un développement de médicaments plus rapide et plus efficace.
Dans l'ensemble, l'automatisation synthétique s'oriente vers des systèmes plus intelligents et plus sophistiqués, capables de gérer des expériences complexes et de générer rapidement de grandes quantités de données qui peuvent être utilisées pour optimiser davantage le processus de découverte de médicaments. À l'avenir, nous pouvons nous attendre à une progression des processus à forte intensité de main-d'œuvre vers des systèmes hautement automatisés et intelligents qui peuvent révolutionner la découverte de médicaments et conduire à de nouveaux traitements pour un large éventail de maladies.
Compte tenu des conclusions de ces articles et des progrès de la rétrosynthèse assistée par ordinateur, comment voyez-vous l'intégration continue de l'intelligence artificielle et de l'automatisation façonner le paysage de la synthèse chimique dans les années à venir ?
L'intégration continue de l'intelligence artificielle et de l'automatisation devrait façonner de manière spectaculaire le paysage de la synthèse chimique à l'avenir. L'IA et l'automatisation devraient accélérer la découverte de médicaments en permettant aux chimistes de synthétiser des composés plus rapidement et plus efficacement. Les chercheurs pourront ainsi tester un plus grand nombre de molécules et explorer un espace chimique plus vaste. L'intégration de l'IA et de l'automatisation peut également contribuer à réduire l'impact environnemental de la synthèse chimique en permettant aux chercheurs d'identifier des voies chimiques plus durables.
Les algorithmes d'IA avec synthèse automatisée peuvent conduire à des réductions de l'erreur humaine et aboutir à une synthèse plus précise, donnant ainsi des produits de meilleure qualité. Elle accélérera l'exploration de l'espace chimique dans la découverte de médicaments et conduira à l'identification de nouveaux composés qui seraient autrement difficiles à découvrir par des méthodes traditionnelles. L'intégration de l'IA et de l'automatisation dans la synthèse chimique a le potentiel de transformer le domaine en profondeur, en accélérant considérablement la vitesse et l'efficacité de la découverte de médicaments tout en améliorant simultanément notre capacité à identifier des molécules médicamenteuses durables et efficaces. L'avenir de la synthèse chimique s'annonce radieux avec l'intégration continue de ces technologies.
Divulgation : Le laboratoire Cernak a reçu des fonds de recherche ou des dons en nature de MilliporeSigma, Burlington, MA, une filiale de Merck, Relay Therapeutics, Janssen Therapeutics, SPT Labtech, et MSD Inc. T.C. détient des parts dans Scorpion Therapeutics et est cofondateur et actionnaire d'Iambic Therapeutics.