Folha em branco:
Desbloquear a Química do Futuro com o Planeamento de Síntese Assistido por Computador

Entrevista com o Professor Tim Cernak
Tivemos o privilégio de entrevistar o Prof. Tim Cernak, um Professor Assistente de Química Medicinal na Universidade de Michigan, cujos diversos interesses de investigação abrangem a síntese química, a automação, a ciência dos dados e muito mais. Com mais de uma década de experiência, o Prof. Cernak tem estado na vanguarda da revolução neste domínio. Nesta entrevista, mergulhamos no mundo do planeamento de síntese assistido por computador (CASP), um campo que aproveita a automação, a análise computacional e a inteligência artificial para simplificar as sínteses químicas. Cernak discutirá o papel fundamental do CASP, a evolução dos programas baseados em regras para a aprendizagem automática e a sinergia entre os conhecimentos humanos e a IA. Exploraremos a forma como as redes neuronais e as regras de reação codificadas por especialistas aumentam a precisão sintética e discutiremos descobertas recentes como a síntese sustentável a partir de resíduos industriais. Além disso, descobriremos o potencial da síntese orgânica impulsionada pela IA e exploraremos as perspectivas para o futuro. Tim Cernak enquanto viajamos pelos domínios do CASP, da automatização laboratorial e do futuro promissor da automatização inteligente na química sintética.

Prof. Timothy Cernak
Professor Assistente de Química Medicinal e Química
Tim Cernak nasceu em Montreal, Canadá, em 1980. Obteve um B.Sc. em Química na Universidade de British Columbia Okanagan e aí estudou o perfil aromático dos vinhos Chardonnay. Jim Gleason na Universidade McGill, Tim foi bolseiro de pós-doutoramento da FQRNT com Tristan Lambert na Universidade de Columbia. Em 2009, Tim juntou-se à equipa de Química Medicinal da Merck Sharp & Dohme em Rahway, Nova Jersey. Aí desenvolveu tecnologias para a síntese miniaturizada e a funcionalização em fase avançada. Em 2013, Tim mudou-se para as instalações da Merck em Boston. Em 2018, o Dr. Cernak juntou-se ao Departamento de Química Medicinal da Universidade de Michigan em Ann Arbor como Professor Assistente. O Laboratório Cernak está a explorar uma interface de síntese química e ciência de dados. Tim é cofundador da Entos, Inc.
No domínio do planeamento de síntese assistido por computador, que papel desempenha o CASP na integração da intuição humana e das capacidades computacionais?
O Planeamento de Síntese Assistido por Computador (CASP) é um campo em rápido crescimento com uma história rica. Os sistemas CASP são concebidos para ajudar os químicos no processo de tomada de decisões, sugerindo Rotas sintéticas que satisfaçam critérios específicos como o rendimento, o custo e a segurança.
Talvez mais do que qualquer outro domínio da ciência, a síntese total abraça e celebra a arte e a elegância do seu processo. O campo destila anos de desenvolvimentos em planeamento estratégico, sistemas de lógica desenvolvida e modos de reatividade experimental inovadores e inéditos numa série de passos de reação planeados. O crescente corpus de reacções químicas, e as regras e mecanismos associados, não podem ser memorizados por um ser humano. Curiosamente, no entanto, elas seguem todas as regras de um jogo e podem ser codificadas num computador. Esta lógica combina o processo humano de tomada de decisões, o conhecimento especializado e a intuição química com o poder computacional dos modelos e algoritmos de aprendizagem automática para gerar rotas sintéticas eficientes.
Pode destacar a progressão dos programas baseados em regras para a aprendizagem automática no contexto da análise computacional do planeamento sintético?
Claro, no início os programas baseados em regras baseavam-se em conjuntos de reacções químicas e transformações de grupos funcionais com curadoria manual para gerar rotas sintéticas. Estas abordagens envolvem a curadoria manual de regras de reação, o que confere um contexto de nível especializado, mas limita o número de regras que podem ser consideradas, especialmente ao ritmo a que novas regras de reação são comunicadas na literatura primária. Mais recentemente, os métodos de aprendizagem automática (ML) surgiram como uma ferramenta poderosa para o planeamento de síntese química, porque podem incorporar grandes conjuntos de dados de reacções químicas.
Quais são os marcos significativos e as implicações da utilização de algoritmos de inteligência artificial para propor rotas sintéticas na síntese de pequenas moléculas?
Os algoritmos de síntese modernos estão a começar a ir além do óbvio e a enfrentar desafios de síntese mais complexos. As gerações anteriores de CASD podiam seguir as regras da química orgânica, mas as respostas não estavam muito longe das respostas óbvias. À medida que o corpus de reacções disponíveis a considerar tem aumentado, começam a surgir sugestões mais inovadoras. A validação experimental de rotas planeadas por computador está finalmente a tornar-se mais popular, com alguns marcos importantes, incluindo a execução totalmente automatizada em plataformas robóticas, a geração de produtos naturais complexos por rotas planeadas por computador que são indistinguíveis das rotas planeadas por humanos e parcerias homem-computador que chegaram a receitas de síntese excecionalmente breves para aceder a produtos naturais. A fusão de técnicas de experimentação de Alto Rendimento é uma nova e excitante área que promete acelerar ainda mais o processo de descoberta de medicamentos. À medida que forem ficando disponíveis cada vez mais dados de reacções capturados sistematicamente e legíveis por máquinas, as previsões de aprendizagem automática irão melhorar. No futuro, é provável que vejamos ainda mais previsões baseadas na física codificadas em cálculos de retrosíntese.
Qual é a sinergia entre as abordagens de peritos e de aprendizagem automática para melhorar o planeamento retrosintético?
No planeamento retrosintético, o objetivo é identificar as melhores rotas sintéticas para uma molécula alvo, trabalhando para trás a partir da molécula alvo para materiais de partida mais simples. As abordagens de peritos e de aprendizagem automática (ML) podem ser utilizadas em conjunto para melhorar a eficácia do planeamento retrosintético.
As abordagens especializadas baseiam-se no conhecimento e na experiência de químicos humanos para identificar as principais etapas de uma síntese. Estas abordagens baseiam-se frequentemente num conjunto de regras químicas selecionadas manualmente que foram desenvolvidas ao longo de anos de investigação. Embora estas abordagens especializadas sejam valiosas, estão limitadas pelo âmbito e complexidade das transformações que podem ser descritas utilizando regras selecionadas manualmente.
As abordagens de ML, por outro lado, podem analisar grandes conjuntos de dados de reacções químicas conhecidas e aprender automaticamente padrões e transformações que são difíceis ou impossíveis de captar utilizando abordagens especializadas. A capacidade dos algoritmos de ML para identificar estes novos padrões e transformações pode aumentar o conhecimento do domínio e a intuição dos químicos humanos.
A sinergia entre as abordagens de peritos e de ML no planeamento retrosintético pode ser vista no desenvolvimento de algoritmos de ML guiados por peritos. Nestas abordagens, o conhecimento especializado é utilizado para orientar a seleção de potenciais Rotas sintéticas geradas por um modelo de ML. Isto permite uma maior precisão e especificidade na seleção de Rotas sintéticas, ao mesmo tempo que se beneficia da Eficiência e escala dos algoritmos de ML.
Em geral, a combinação de abordagens especializadas e de ML no planeamento retrosintético tem o potencial de melhorar significativamente a velocidade e a eficácia deste processo, conduzindo a uma Descoberta de medicamentos mais eficiente e, em última análise, ao desenvolvimento de novas terapias para os doentes.
Pode explicar como é que as redes neuronais treinadas em regras de reação codificadas por especialistas contribuem para alcançar uma maior precisão sintética no planeamento retrosintético?
As redes neuronais treinadas com base em Regras de Reação codificadas por especialistas podem melhorar a precisão das previsões sintéticas no planeamento retrosintético, incorporando conhecimentos químicos detalhados e mantendo-se suficientemente flexíveis para lidar com reacções incompletas ou novas.
As regras de reação codificadas por especialistas são um conjunto de regras químicas pré-definidas que descrevem Transformações químicas conhecidas. Estas regras baseiam-se em anos de investigação e conhecimento do domínio e podem ser utilizadas como base para a formação de redes neuronais. Ao treinar redes neuronais com base nestas regras, as redes podem aprender a reconhecer padrões de reacções e a prever melhor os resultados das Transformações químicas.
A utilização de redes neuronais treinadas com base em regras de reação codificadas por especialistas também pode ajudar a enfrentar o desafio das reacções incompletas ou novas. Por exemplo, se uma transformação química só tiver sido observada anteriormente num conjunto limitado de reacções, a rede neuronal pode ser treinada para prever o resultado dessa transformação com base nos dados disponíveis e nas regras dos peritos. Isto é particularmente útil no contexto da Descoberta de medicamentos, em que muitas das moléculas-alvo nunca foram sintetizadas antes.
Ao incorporar conhecimentos químicos detalhados sob a forma de regras codificadas por especialistas, as redes neuronais treinadas com base nessas regras podem alcançar uma maior precisão no planeamento retrosintético. Isto não só ajuda os químicos a prever os resultados das reacções químicas com maior precisão, como também acelera o processo de Descoberta de medicamentos, ajudando os químicos a identificar as melhores rotas sintéticas para novos compostos.
Como é que se utiliza uma biblioteca de reacções químicas e metadados para conceber sínteses sustentáveis?
Este é um aspeto importante do trabalho futuro. A vantagem da retrosíntese computacional é que é possível desmerecer os protocolos que utilizam reagentes ecologicamente insensíveis, por exemplo, reacções que requerem diclorometano como solvente ou que produzem uma grande quantidade de resíduos metálicos. Entretanto, é possível recompensar os protocolos que utilizam opções mais ecológicas.
Uma forma de o fazer é incorporar na biblioteca informações sobre o impacto ambiental de reacções químicas específicas. É possível codificar uma variedade de factores, como a quantidade de resíduos gerados, a energia necessária e a toxicidade dos reagentes. Isto permite aos químicos identificar rotas sintéticas sustentáveis para moléculas alvo, selecionando reacções da biblioteca que satisfaçam os critérios de sustentabilidade exigidos.
Para além da informação sobre o impacto ambiental de reacções químicas específicas, os metadados sobre reacções químicas também podem ser utilizados para conceber sínteses sustentáveis. Estes metadados podem incluir informações como os rendimentos das reacções, os solventes utilizados e os requisitos energéticos. Ao analisar estes metadados, os químicos podem identificar Rotas sintéticas mais eficientes e sustentáveis.
Ao tirar partido de uma biblioteca de reacções químicas e metadados para conceber sínteses sustentáveis, os químicos podem reduzir o impacto ambiental dos processos sintéticos, conduzindo a uma indústria química mais sustentável e com menos desperdício. Além disso, ao selecionar reacções de uma biblioteca de reacções sustentáveis, os químicos podem também melhorar a velocidade e a relação custo-eficácia do processo de Descoberta de medicamentos, conduzindo a tratamentos mais acessíveis e económicos para os pacientes.
No contexto da síntese orgânica baseada na inteligência artificial, como é que os algoritmos de IA e as plataformas robóticas podem ser acoplados?
O acoplamento de algoritmos de IA e plataformas robóticas na síntese orgânica orientada pela inteligência artificial pode melhorar significativamente a velocidade e a Eficiência do processo de descoberta. A síntese orgânica baseada na IA está a automatizar a lógica da síntese, enquanto as plataformas robóticas estão a automatizar o trabalho prático de laboratório, pelo que se trata de uma combinação poderosa.
Os algoritmos de IA podem ser utilizados para prever as rotas sintéticas ideais para uma determinada molécula alvo, tirando partido de vastas bases de dados de reações químicas e dados relacionados. As plataformas robóticas podem então ser utilizadas para sintetizar a molécula alvo com base nas rotas previstas. A utilização destas plataformas permite a experimentação rápida e a síntese em Alto Rendimento de um grande número de compostos.
A combinação de algoritmos de IA e plataformas robóticas pode ainda ser melhorada através da utilização de mecanismos de feedback loop para otimizar o processo de síntese em tempo real. Por exemplo, um algoritmo de IA poderia monitorizar o processo sintético e fornecer feedback sobre as condições de reação, levando a uma maior otimização da rota sintética e, em última análise, a melhores resultados.
Outra forma de associar algoritmos de IA e plataformas microfluídicas robóticas é através da utilização de algoritmos de aprendizagem automática para melhorar o desempenho da plataforma microfluídica. Através da monitorização contínua e do feedback, os algoritmos de aprendizagem automática podem aprender a prever as condições de reação ideais e melhorar a Eficiência e a precisão da plataforma microfluídica.
Em última análise, ao combinar o poder dos algoritmos de IA e das plataformas microfluídicas robóticas, o processo de descoberta de medicamentos pode ser acelerado, permitindo a rápida identificação de novos candidatos a medicamentos. Isto tem o potencial de melhorar significativamente os resultados dos doentes, proporcionando tratamentos mais rápidos e mais eficazes para uma vasta gama de doenças.
O mais interessante é que a robótica de laboratório está a tornar-se cada vez mais acessível a todos, através de fornecedores comerciais ou de plataformas de hardware democratizadas de código aberto. O campo irá certamente acelerar ainda mais, uma vez que a automação laboratorial está a desempenhar um papel cada vez mais importante na formação de programas de graduação e pós-graduação, preparando a próxima geração de investigadores para este futuro de trabalho.
Como é que a automatização laboratorial transformou a síntese tradicional e quais são as principais vantagens que oferece em relação à operação manual?
A automação laboratorial transformou a síntese tradicional ao permitir a experimentação de Alto Rendimento e a síntese mais rápida e precisa de compostos orgânicos complexos. Algumas das principais vantagens que oferece em relação à operação manual incluem maior Eficiência, maior precisão, melhor reprodutibilidade, capacidade de lidar com materiais perigosos e integração com inteligência artificial e algoritmos de aprendizagem automática.
A automatização permite a síntese rápida e reprodutível de um grande número de compostos, reduzindo o tempo e o esforço necessários para tarefas químicas de rotina e libertando os cientistas para se concentrarem em investigação mais complexa. O equipamento automatizado pode dispensar volumes precisos de reagentes, conduzindo a uma menor variabilidade nos resultados das reacções e a uma maior precisão dos resultados, e pode manusear materiais e reacções perigosos em segurança, protegendo os investigadores de substâncias químicas potencialmente nocivas.
A automatização garante que as experiências são realizadas em condições consistentes, reduzindo a probabilidade de erro humano e aumentando a reprodutibilidade dos resultados. Pode ser integrada com inteligência artificial e algoritmos de aprendizagem automática para otimizar ainda mais as operações laboratoriais e acelerar o desenvolvimento de novos compostos.
De um modo geral, a automatização laboratorial tem o potencial de melhorar significativamente a Eficiência e a precisão da síntese tradicional, conduzindo a uma Descoberta de medicamentos mais rápida e, em última análise, a tratamentos mais eficazes para os doentes.
Quais são as perspectivas para o futuro da automação sintética e como prevê a progressão dos processos de trabalho intensivo para a automação inteligente?
Prevê-se que o futuro da automação sintética seja marcado por avanços contínuos na robótica, na aprendizagem automática e na inteligência artificial, conduzindo a sistemas de automação cada vez mais sofisticados e inteligentes.
Uma das principais áreas de foco na futura automação sintética será o desenvolvimento de laboratórios autónomos que possam funcionar 24 horas por dia, 7 dias por semana, sem intervenção humana. Estes sistemas serão equipados com robótica e algoritmos de aprendizagem automática capazes de realizar tarefas de rotina, monitorizar experiências e tomar decisões autónomas com base nos dados gerados.
Outro domínio de interesse será a maior integração da inteligência artificial no processo de descoberta de medicamentos. Isto implicará o desenvolvimento de algoritmos de IA que possam analisar grandes quantidades de dados químicos, prever os resultados das reacções químicas e otimizar as condições experimentais em tempo real.
Ao longo do tempo, espera-se que a automação sintética se torne cada vez mais inteligente, com os sistemas de automação a assumirem tarefas cada vez mais complexas e a gerarem novos conhecimentos que podem acelerar a descoberta de medicamentos. Estes sistemas altamente automatizados permitirão aos investigadores realizar uma vasta gama de experiências com o mínimo de trabalho e de supervisão humana, conduzindo a um desenvolvimento de medicamentos mais rápido e mais eficiente.
De um modo geral, a trajetória da automação sintética é em direção a sistemas mais inteligentes e sofisticados que podem lidar com experiências complexas e gerar rapidamente grandes quantidades de dados que podem ser utilizados para otimizar ainda mais o processo de descoberta de medicamentos. No futuro, podemos esperar ver uma progressão de processos de trabalho intensivo para sistemas inteligentes e altamente automatizados que podem revolucionar a descoberta de medicamentos e conduzir a novos tratamentos para uma vasta gama de doenças.
Tendo em conta os conhecimentos adquiridos nestes documentos e os avanços na retrosíntese assistida por computador, como vê a integração contínua da inteligência artificial e da automação a moldar o panorama da síntese química nos próximos anos?
Espera-se que a integração contínua da inteligência artificial e da automação molde dramaticamente o panorama da síntese química no futuro. Espera-se que a IA e a automação acelerem a Descoberta de medicamentos, permitindo que os químicos sintetizem compostos de forma mais rápida e eficiente. Isto permitirá aos investigadores testar um maior número de moléculas e explorar uma gama mais alargada de espaços químicos. A integração da IA e da automatização pode também ajudar a reduzir o impacto ambiental da Síntese Química, permitindo aos investigadores identificar rotas químicas mais sustentáveis.
Os algoritmos de IA com síntese automatizada podem levar a uma redução dos erros humanos e resultar numa síntese mais precisa, dando assim origem a Produtos de maior qualidade. Acelerará a Exploração do espaço químico na Descoberta de medicamentos e conduzirá à identificação de novos compostos que, de outro modo, seriam difíceis de descobrir através dos métodos tradicionais. A integração da IA e da automatização na síntese química tem o potencial de transformar profundamente este domínio, acelerando consideravelmente a velocidade e a eficiência da descoberta de medicamentos e melhorando simultaneamente a nossa capacidade de identificar moléculas de medicamentos sustentáveis e eficazes. O futuro da Síntese Química parece brilhante com a integração contínua destas tecnologias.
Divulgação: O Laboratório Cernak recebeu financiamento para investigação ou donativos em géneros da MilliporeSigma, Burlington, MA, uma filial da Merck, Relay Therapeutics, Janssen Therapeutics, SPT Labtech e MSD Inc. T.C. detém uma participação no capital da Scorpion Therapeutics e é cofundador e acionista da Iambic Therapeutics.