Libro blanco:
Desbloquear la química del mañana con la planificación de la síntesis asistida por ordenador

Entrevista con el profesor Tim Cernak
Hemos tenido el privilegio de entrevistar al profesor Tim Cernak, catedrático adjunto de Química Médica en la Universidad de Michigan, cuyos diversos intereses de investigación abarcan la síntesis química, la automatización, la ciencia de datos y mucho más. Con más de una década de experiencia, el profesor Cernak ha estado a la vanguardia de la revolución en este campo. En esta entrevista, nos adentramos en el mundo de la planificación de síntesis asistida por ordenador (CASP), un campo que aprovecha la automatización, el análisis computacional y la inteligencia artificial para agilizar las síntesis químicas. El profesor Cernak hablará del papel fundamental de la CASP, de la evolución de los programas basados en reglas al aprendizaje automático y de la sinergia entre la experiencia humana y la IA. Exploraremos cómo las redes neuronales y las reglas de reacción codificadas por expertos mejoran la precisión sintética y hablaremos de avances recientes como la síntesis sostenible a partir de residuos industriales. Además, descubriremos el potencial de la síntesis orgánica impulsada por IA y exploraremos las perspectivas de futuro. Acompáñenos en esta esclarecedora conversación con el profesor Tim Cernak mientras viajamos por los ámbitos de la CASP, la automatización de laboratorios y el prometedor futuro de la automatización inteligente en la química sintética.

Prof. Timothy Cernak
Profesor Adjunto de Química Médica y Química
Tim Cernak nació en Montreal (Canadá) en 1980. Se licenció en Química por la Universidad de British Columbia Okanagan y allí estudió el perfil aromático de los vinos Chardonnay. Tras su doctorado en síntesis total con el profesor Jim Gleason en la Universidad McGill, Tim fue becario posdoctoral de la FQRNT con Tristan Lambert en la Universidad de Columbia. En 2009, Tim se incorporó al equipo de Química Medicinal de Merck Sharp & Dohme en Rahway, Nueva Jersey. Allí desarrolló tecnologías para la síntesis miniaturizada y la funcionalización de última etapa. En 2013, Tim se trasladó a la sede de Merck en Boston. En 2018, el Dr. Cernak se unió al Departamento de Química Medicinal de la Universidad de Michigan en Ann Arbor como profesor asistente. El Laboratorio Cernak está explorando una interfaz de síntesis química y ciencia de datos. Tim es cofundador de Entos, Inc.
En el campo de la Planificación de la síntesis asistida por ordenador, ¿qué papel desempeña el CASP en la integración de la intuición humana y las capacidades computacionales?
La Planificación de la síntesis asistida por ordenador (CASP) es un campo en rápido crecimiento con una rica historia. Los sistemas CASP están diseñados para ayudar a los químicos en el proceso de toma de decisiones sugiriendo rutas sintéticas que cumplan criterios específicos como el rendimiento, el coste y la seguridad.
Quizá más que cualquier otro campo de la ciencia, la síntesis total abarca y celebra el arte y la elegancia de su proceso. Este campo destila años de avances en planificación estratégica, sistemas de lógica desarrollada y modos de reactividad experimental innovadores y novedosos en una serie de pasos de reacción planificados. El creciente corpus de reacciones químicas, y sus reglas y mecanismos asociados, no pueden ser memorizados por un ser humano. Pero, curiosamente, siguen todas las reglas de un juego y pueden codificarse en un ordenador. Esta lógica combina el proceso humano de toma de decisiones, el conocimiento experto y la intuición química con la potencia computacional de los modelos y algoritmos de aprendizaje automático para generar rutas sintéticas eficientes.
¿Puede destacar la progresión desde los programas basados en reglas hasta el aprendizaje automático en el contexto del análisis computacional de la planificación sintética?
Claro, al principio los programas basados en reglas se basaban en conjuntos de reacciones químicas y transformaciones de grupos funcionales seleccionados manualmente para generar rutas sintéticas. Estos enfoques implican la curación manual de las reglas de reacción, lo que imparte un contexto de nivel experto pero limita el número de reglas que pueden considerarse, especialmente con el ritmo al que se publican nuevas reglas de reacción en la literatura primaria. Más recientemente, los métodos de aprendizaje automático han surgido como una potente herramienta para la planificación de la síntesis química, ya que pueden incorporar grandes conjuntos de datos de reacciones químicas.
¿Cuáles son los hitos significativos y las implicaciones del uso de algoritmos de inteligencia artificial para proponer rutas sintéticas en la síntesis de moléculas pequeñas?
Los algoritmos de síntesis modernos empiezan a ir más allá de lo obvio y se adentran en retos de síntesis más complejos. Las primeras generaciones de CASD podían seguir las reglas de la química orgánica, pero las respuestas no se alejaban demasiado de las respuestas obvias. A medida que ha ido creciendo el corpus de reacciones disponibles, han empezado a surgir sugerencias más novedosas. Por fin se está popularizando la validación experimental de rutas planificadas por ordenador, con algunos hitos clave como la ejecución totalmente automatizada en plataformas robóticas, la generación de productos naturales complejos mediante rutas planificadas por ordenador que son indistinguibles de las rutas planificadas por humanos, y asociaciones entre humanos y ordenadores que han llegado a recetas de síntesis excepcionalmente breves para acceder a productos naturales. Las técnicas de experimentación de alto rendimiento por fusión constituyen un nuevo y apasionante campo que promete acelerar aún más el proceso de descubrimiento de fármacos. A medida que se disponga de más datos de reacciones capturados sistemáticamente y legibles por las máquinas, mejorarán las predicciones del aprendizaje automático. En el futuro es probable que veamos aún más predicciones basadas en la física codificadas en cálculos de retrosíntesis.
¿Cuál es la sinergia entre los enfoques experto y de aprendizaje automático para mejorar la planificación retrosintética?
En la planificación retrosintética, el objetivo es identificar rutas sintéticas óptimas para una molécula diana trabajando hacia atrás desde la molécula diana hasta materiales de partida más sencillos. Para mejorar la eficacia de la planificación retrosintética pueden utilizarse conjuntamente métodos expertos y de aprendizaje automático.
Los enfoques expertos se basan en los conocimientos y la experiencia de los químicos para identificar los pasos clave de una síntesis. A menudo se basan en un conjunto de reglas químicas seleccionadas manualmente y desarrolladas a lo largo de años de investigación. Aunque estos enfoques expertos son valiosos, están limitados por el alcance y la complejidad de las transformaciones que pueden describirse utilizando reglas curadas manualmente.
Por otro lado, los métodos de ML pueden analizar grandes conjuntos de datos de reacciones químicas conocidas y aprender automáticamente patrones y transformaciones que son difíciles o imposibles de captar con métodos expertos. La capacidad de los algoritmos de ML para identificar estos nuevos patrones y transformaciones puede aumentar el conocimiento del dominio y la intuición de los químicos humanos.
La sinergia entre los enfoques expertos y de ML en la planificación retrosintética puede observarse en el desarrollo de algoritmos de ML guiados por expertos. En estos enfoques, el conocimiento experto se utiliza para guiar la selección de posibles rutas sintéticas generadas por un modelo de ML. Esto permite una mayor precisión y especificidad en la selección de rutas sintéticas, sin dejar de beneficiarse de la eficiencia y la escala de los algoritmos de ML.
En general, la combinación de enfoques expertos y de ML en la planificación retrosintética tiene el potencial de mejorar significativamente la velocidad y la eficacia de este proceso, lo que conduce a un descubrimiento de fármacos más eficiente y, en última instancia, al desarrollo de nuevas terapias para los pacientes.
¿Podría explicarnos cómo las redes neuronales entrenadas en reglas de reacción codificadas por expertos contribuyen a lograr una mayor precisión sintética en la planificación retrosintética?
Las redes neuronales entrenadas con reglas de reacción codificadas por expertos pueden mejorar la precisión de las predicciones sintéticas en la planificación retrosintética al incorporar conocimientos químicos detallados y, al mismo tiempo, ser lo suficientemente flexibles para abordar reacciones incompletas o novedosas.
Las reglas de reacción codificadas por expertos son un conjunto de reglas químicas predefinidas que describen transformaciones químicas conocidas. Estas reglas se basan en años de investigación y conocimientos del sector y pueden utilizarse como base para el entrenamiento de redes neuronales. Al entrenar las redes neuronales con estas reglas, las redes pueden aprender a reconocer patrones de reacciones y predecir mejor los resultados de las transformaciones químicas.
El uso de redes neuronales entrenadas con reglas de reacción codificadas por expertos también puede ayudar a afrontar el reto de las reacciones incompletas o novedosas. Por ejemplo, si una transformación química sólo se ha observado previamente en un conjunto limitado de reacciones, la red neuronal puede entrenarse para predecir el resultado de esa transformación basándose en los datos disponibles y en las reglas de los expertos. Esto resulta especialmente útil en el contexto del descubrimiento de fármacos, donde muchas de las moléculas objetivo nunca se han sintetizado antes.
Al incorporar conocimientos químicos detallados en forma de reglas codificadas por expertos, las redes neuronales entrenadas con estas reglas pueden lograr una mayor precisión en la planificación retrosintética. Esto no sólo ayuda a los químicos a predecir con mayor exactitud los resultados de las reacciones químicas, sino que también acelera el proceso de descubrimiento de fármacos al ayudar a los químicos a identificar rutas sintéticas óptimas para nuevos compuestos.
¿Cómo se aprovecha una biblioteca de reacciones químicas y metadatos para diseñar síntesis sostenibles?
Este es un aspecto importante del trabajo futuro. Lo bueno de la retrosíntesis computacional es que se pueden demeritar los protocolos que utilizan reactivos poco ecológicos, por ejemplo las reacciones que requieren diclorometano como disolvente o que producen una gran cantidad de residuos metálicos. Mientras tanto, puede recompensar los protocolos que aprovechen opciones más respetuosas con el medio ambiente.
Una forma de hacerlo es incorporar a la biblioteca información sobre el impacto medioambiental de reacciones químicas concretas. Se pueden codificar diversos factores, como la cantidad de residuos generados, la energía necesaria y la toxicidad de los reactivos. Esto permite a los químicos identificar rutas sintéticas sostenibles para moléculas objetivo, seleccionando reacciones de la biblioteca que cumplan los criterios de sostenibilidad requeridos.
Además de la información sobre el impacto medioambiental de reacciones químicas concretas, los metadatos sobre reacciones químicas también pueden utilizarse para diseñar síntesis sostenibles. Estos metadatos pueden incluir información como el rendimiento de las reacciones, los disolventes utilizados y los requisitos energéticos. Analizando estos metadatos, los químicos pueden identificar rutas sintéticas más eficientes y sostenibles.
Al aprovechar una biblioteca de reacciones químicas y metadatos para diseñar síntesis sostenibles, los químicos pueden reducir el impacto ambiental de los procesos sintéticos, lo que conduce a una industria química más sostenible y menos derrochadora. Además, al seleccionar reacciones de una biblioteca de reacciones sostenibles, los químicos también pueden mejorar la velocidad y la rentabilidad del proceso de descubrimiento de fármacos, lo que conduce a tratamientos más accesibles y asequibles para los pacientes.
En el contexto de la síntesis orgánica impulsada por la inteligencia artificial, ¿cómo pueden acoplarse los algoritmos de IA y las plataformas robóticas?
El acoplamiento de algoritmos de IA y plataformas robóticas en la síntesis orgánica impulsada por inteligencia artificial podría mejorar significativamente la velocidad y la eficiencia del proceso de descubrimiento. La síntesis orgánica impulsada por IA automatiza la lógica de la síntesis, mientras que las plataformas robóticas automatizan el trabajo práctico de laboratorio, por lo que se trata de una potente combinación.
Los algoritmos de IA pueden utilizarse para predecir las rutas de síntesis óptimas para una molécula diana determinada, aprovechando vastas bases de datos de reacciones químicas y datos relacionados. A continuación, pueden utilizarse plataformas robóticas para sintetizar la molécula objetivo basándose en las rutas predichas. El uso de estas plataformas permite una experimentación rápida y la síntesis de alto rendimiento de un gran número de compuestos.
La combinación de algoritmos de IA y plataformas robóticas puede mejorarse aún más utilizando mecanismos de retroalimentación para optimizar el proceso sintético en tiempo real. Por ejemplo, un algoritmo de IA podría supervisar el proceso de síntesis y proporcionar información sobre las condiciones de reacción, lo que conduciría a una mayor optimización de la ruta de síntesis y, en última instancia, a mejores resultados.
Otra forma de combinar algoritmos de IA y plataformas microfluídicas robotizadas es mediante el uso de algoritmos de aprendizaje automático para mejorar el rendimiento de la plataforma microfluídica. A través de la monitorización continua y la retroalimentación, los algoritmos de aprendizaje automático pueden aprender a predecir las condiciones óptimas de reacción y mejorar la eficiencia y la precisión de la plataforma de microfluidos.
En última instancia, al combinar la potencia de los algoritmos de IA y las plataformas microfluídicas robóticas, se puede acelerar el proceso de descubrimiento de fármacos, lo que permite la rápida identificación de nuevos candidatos a fármacos. Esto tiene el potencial de mejorar significativamente los resultados de los pacientes al proporcionar tratamientos más rápidos y eficaces para una amplia gama de enfermedades.
Lo más interesante es que la robótica de laboratorio está cada vez más al alcance de todos, a través de proveedores comerciales o plataformas de hardware democratizadas de código abierto. Sin duda, este campo se acelerará aún más, ya que la automatización de laboratorios desempeña un papel cada vez más importante en la enseñanza de los programas de licenciatura y posgrado, preparando a la próxima generación de investigadores para este futuro laboral.
¿Cómo ha transformado la automatización de los laboratorios la síntesis tradicional y cuáles son las principales ventajas que ofrece frente al funcionamiento manual?
La automatización de los laboratorios ha transformado la síntesis tradicional al permitir una experimentación de alto rendimiento y una síntesis más rápida y precisa de compuestos orgánicos complejos. Algunas de las principales ventajas que ofrece sobre el funcionamiento manual son una mayor eficiencia, una mayor precisión, una reproducibilidad mejorada, la capacidad de manipular materiales peligrosos y la integración con algoritmos de inteligencia artificial y aprendizaje automático.
La automatización permite la síntesis rápida y reproducible de un gran número de compuestos, reduciendo el tiempo y el esfuerzo necesarios para las tareas químicas rutinarias y liberando a los científicos para que puedan centrarse en investigaciones más complejas. Los equipos automatizados pueden dispensar volúmenes precisos de reactivos, lo que reduce la variabilidad de los resultados de las reacciones y mejora la exactitud de los resultados, y pueden manipular materiales y reacciones peligrosos de forma segura, protegiendo a los investigadores de sustancias químicas potencialmente nocivas.
La automatización garantiza que los experimentos se realicen en condiciones uniformes, lo que reduce la probabilidad de error humano y aumenta la reproducibilidad de los resultados. Puede integrarse con algoritmos de inteligencia artificial y aprendizaje automático para optimizar aún más las operaciones de laboratorio y acelerar el desarrollo de nuevos compuestos.
En general, la automatización del laboratorio tiene el potencial de mejorar significativamente la eficiencia y la precisión de la síntesis tradicional, lo que conduce a un descubrimiento de fármacos más rápido y, en última instancia, a tratamientos más eficaces para los pacientes.
¿Cuáles son las perspectivas de futuro de la automatización sintética y cómo se imagina la progresión de los procesos que requieren mucha mano de obra a la automatización inteligente?
Se espera que el futuro de la automatización sintética esté marcado por los continuos avances de la robótica, el aprendizaje automático y la inteligencia artificial, que darán lugar a sistemas de automatización cada vez más sofisticados e inteligentes.
Una de las áreas clave de la futura automatización sintética será el desarrollo de laboratorios autónomos que puedan funcionar 24 horas al día, 7 días a la semana, sin intervención humana. Estos sistemas estarán equipados con algoritmos robóticos y de aprendizaje automático capaces de realizar tareas rutinarias, supervisar experimentos y tomar decisiones autónomas basadas en los datos generados.
Otro ámbito de interés será la mayor integración de la inteligencia artificial en el proceso de Descubrimiento de fármacos. Esto implicará el desarrollo de algoritmos de IA que puedan analizar grandes cantidades de datos químicos, predecir los resultados de las reacciones químicas y optimizar las condiciones experimentales en tiempo real.
Con el tiempo, se espera que la automatización sintética sea cada vez más inteligente, y que los sistemas de automatización asuman tareas cada vez más complejas y generen nuevos conocimientos que puedan acelerar el descubrimiento de fármacos. Estos sistemas altamente automatizados permitirán a los investigadores realizar una amplia gama de experimentos con un mínimo de mano de obra y supervisión humana, lo que conducirá a un desarrollo de fármacos más rápido y eficiente.
En general, la trayectoria de la automatización sintética es hacia sistemas más inteligentes y sofisticados que puedan manejar experimentos complejos y generar rápidamente grandes cantidades de datos que puedan utilizarse para optimizar aún más el proceso de descubrimiento de fármacos. En el futuro, podemos esperar una progresión desde procesos que requieren mucha mano de obra hacia sistemas inteligentes y altamente automatizados que pueden revolucionar el descubrimiento de fármacos y conducir a nuevos tratamientos para una amplia gama de enfermedades.
Teniendo en cuenta las conclusiones de estos artículos y los avances en la retrosíntesis asistida por ordenador, ¿cómo cree que la integración continuada de la inteligenciaartificial y la automatización configurará el panorama de la síntesis química en los próximos años?
Se espera que la integración continuada de la inteligencia artificial y la automatización configure radicalmente el panorama de la síntesis química en el futuro. Se espera que la IA y la automatización aceleren el descubrimiento de fármacos al permitir a los químicos sintetizar compuestos con mayor rapidez y eficacia. Esto permitirá a los investigadores probar un mayor número de moléculas y explorar un espacio químico más amplio. La integración de la IA y la automatización también puede ayudar a reducir el impacto medioambiental de la síntesis química al permitir a los investigadores identificar rutas químicas más sostenibles.
Los algoritmos de IA con síntesis automatizada pueden reducir los errores humanos y dar lugar a síntesis más precisas, con lo que se obtendrán productos de mayor calidad. Acelerará la exploración del espacio químico en el descubrimiento de fármacos y conducirá a la identificación de nuevos compuestos que, de otro modo, serían difíciles de descubrir mediante métodos tradicionales. La integración de la IA y la automatización en la síntesis química tiene el potencial de transformar profundamente este campo, acelerando enormemente la velocidad y la eficiencia del descubrimiento de fármacos y mejorando al mismo tiempo nuestra capacidad para identificar moléculas de fármacos sostenibles y eficaces. El futuro de la Síntesis química parece prometedor con la continua integración de estas tecnologías.
Divulgación: El laboratorio Cernak ha recibido financiación para investigación o donaciones en especie de MilliporeSigma, Burlington, MA, una filial de Merck, Relay Therapeutics, Janssen Therapeutics, SPT Labtech y MSD Inc. T.C. es accionista de Scorpion Therapeutics y cofundador y accionista de Iambic Therapeutics.