White Paper:

Sbloccare la Chimica di domani con la Pianificazione della sintesi assistita dal computer

Intervista al Prof. Tim Cernak

Abbiamo avuto il privilegio di intervistare il Prof. Tim Cernak, assistente alla cattedra di Chimica Medicinale presso l'Università del Michigan, i cui interessi di ricerca spaziano dalla Sintesi chimica all'automazione, alla scienza dei dati e altro ancora. Con oltre dieci anni di esperienza, il Prof. Cernak è stato in prima linea nel rivoluzionare il settore. In questa intervista, ci addentriamo nel mondo della pianificazione assistita da computer della sintesi (CASP), un campo che sfrutta l'automazione, l'analisi computazionale e l'intelligenza artificiale per ottimizzare le sintesi chimiche. Il Prof. Cernak parlerà del ruolo centrale del CASP, dell'evoluzione dai programmi basati su regole all'apprendimento automatico e della sinergia tra competenze umane e IA. Esploreremo come le reti neurali e le Regole scritte da programmatori esperti migliorino l'accuratezza della sintesi e discuteremo di recenti scoperte come la sintesi sostenibile da rifiuti industriali. Inoltre, scopriremo il potenziale della sintesi organica guidata dall'IA ed esploreremo le prospettive per il futuro. Unisciti a noi in questa illuminante conversazione con il Prof. Tim Cernak mentre viaggiamo attraverso i regni della CASP, dell'automazione di laboratorio e del promettente futuro dell'automazione intelligente nella chimica sintetica.

Prof. Timothy Cernak
Professore assistente di Chimica Medicinale e Chimica

Tim Cernak è nato a Montreal, in Canada, nel 1980. Ha conseguito una laurea in Chimica presso la University of British Columbia Okanagan, dove ha studiato il profilo aromatico dei vini Chardonnay. Dopo il dottorato di ricerca in sintesi totale con il Prof. Jim Gleason alla McGill University, Tim è stato borsista post-dottorato FQRNT con Tristan Lambert alla Columbia University. Nel 2009, Tim è entrato a far parte del team di Chimica Medicinale di Merck Sharp & Dohme a Rahway, New Jersey. Qui ha sviluppato tecnologie per la sintesi miniaturizzata e la funzionalizzazione in fase avanzata. Nel 2013, Tim si è trasferito presso la sede Merck di Boston. Nel 2018, il dottor Cernak è entrato a far parte del Dipartimento di Chimica Medicinale dell'Università del Michigan ad Ann Arbor come professore assistente. Il laboratorio Cernak sta esplorando l'interfaccia tra sintesi chimica e scienza dei dati. Tim è cofondatore di Entos, Inc.

Nel campo della pianificazione della sintesi assistita dal computer, quale ruolo svolge il CASP nell'integrare l'intuizione umana e le capacità computazionali?

La Pianificazione assistita da computer della sintesi (CASP) è un campo in rapida crescita e con una ricca storia. I sistemi CASP sono progettati per aiutare i chimici nel processo decisionale, suggerendo vie sintetiche che soddisfano criteri specifici come resa, costi e sicurezza.

Forse più di ogni altro campo della scienza, la sintesi totale abbraccia e celebra l'arte e l'eleganza del suo processo. Il campo distilla anni di sviluppi nella pianificazione strategica, sistemi di logica sviluppata e modalità di reattività sperimentale innovative e inedite in una serie di fasi di reazione pianificate. Il crescente corpus di reazioni chimiche, con le relative regole e meccanismi, non può essere memorizzato da un essere umano. Tuttavia, è interessante notare che seguono tutte le regole di un gioco e possono essere codificate in un computer. Questa logica combina il processo decisionale umano, le conoscenze degli esperti e l'intuizione chimica con la potenza di calcolo dei modelli e degli algoritmi di apprendimento automatico per generare efficienti vie sintetiche.


Può evidenziare la progressione dai programmi basati su regole all'apprendimento automatico nel contesto dell'analisi computazionale della pianificazione sintetica?

Certo, all'inizio i programmi basati su regole si basavano su insiemi curati manualmente di reazioni chimiche e trasformazioni di gruppi funzionali per generare percorsi sintetici. Questi approcci comportano la curatela manuale delle regole di reazione, che conferisce un contesto esperto ma limita il numero di regole che possono essere prese in considerazione, soprattutto con il ritmo con cui nuove regole di reazione vengono riportate nella letteratura primaria. Più recentemente, i metodi di apprendimento automatico (ML) sono emersi come un potente strumento per la pianificazione della Sintesi chimica, perché possono incorporare grandi insiemi di dati di reazioni chimiche.

Quali sono le tappe significative e le implicazioni dell'uso di algoritmi di intelligenza artificiale per proporre vie sintetiche nella sintesi di piccole molecole?

I moderni algoritmi di sintesi stanno iniziando a spingersi oltre l'ovvio e ad affrontare sfide di sintesi più complesse. Le prime generazioni di CASD potevano seguire le regole della Chimica organica, ma le risposte non erano troppo lontane da quelle ovvie. Con l'aumento del corpus di reazioni disponibili da prendere in considerazione, cominciano a emergere suggerimenti più innovativi. La convalida sperimentale dei percorsi pianificati al computer sta finalmente diventando più popolare, con alcune tappe fondamentali come l'esecuzione completamente automatizzata su piattaforme robotiche, la generazione di prodotti naturali complessi da parte di percorsi pianificati al computer che sono indistinguibili da quelli pianificati dall'uomo e le collaborazioni uomo-computer che sono arrivate a ricette di sintesi eccezionalmente brevi per accedere a prodotti naturali. Le tecniche di sperimentazione High-Throughput rappresentano una nuova area entusiasmante che promette di accelerare ulteriormente il processo di scoperta dei farmaci. Man mano che saranno disponibili sempre più dati di reazione acquisiti sistematicamente e leggibili dalla macchina, le previsioni dell'apprendimento automatico miglioreranno. In futuro vedremo probabilmente un numero ancora maggiore di previsioni basate sulla fisica codificate nei calcoli di retrosintesi.

Qual è la sinergia tra approcci esperti e di apprendimento automatico per migliorare la pianificazione retrosintetica?

Nella pianificazione retrosintetica, l'obiettivo è identificare le vie sintetiche ottimali per una molecola target lavorando a ritroso dalla molecola target a materiali di partenza più semplici. Gli approcci esperti e di apprendimento automatico (ML) possono essere utilizzati insieme per migliorare l'efficacia della pianificazione retrosintetica.

Gli approcci esperti si basano sulle conoscenze e sull'esperienza dei chimici umani per identificare i passaggi chiave di una sintesi. Questi approcci sono spesso basati su un insieme di regole chimiche curate manualmente e sviluppate in anni di ricerca. Pur essendo validi, questi approcci esperti sono limitati dalla portata e dalla complessità delle trasformazioni che possono essere descritte utilizzando regole curate manualmente.

Gli approcci ML, invece, sono in grado di analizzare grandi insiemi di dati di reazioni chimiche note e di apprendere automaticamente modelli e trasformazioni che sono difficili o impossibili da catturare con approcci esperti. La capacità degli algoritmi di ML di identificare questi nuovi modelli e trasformazioni può aumentare la conoscenza del dominio e l'intuizione dei chimici umani.

La sinergia tra approcci esperti e ML nella pianificazione retrosintetica può essere vista nello sviluppo di algoritmi ML guidati da esperti. In questi approcci, le conoscenze degli esperti vengono utilizzate per guidare la selezione delle potenziali vie sintetiche generate da un modello ML. Ciò consente una maggiore accuratezza e specificità nella selezione delle vie sintetiche, pur beneficiando dell'efficienza e della scala degli algoritmi di ML.

Nel complesso, la combinazione di approcci esperti e ML nella pianificazione retrosintetica ha il potenziale per migliorare significativamente la velocità e l'efficacia di questo processo, portando a una scoperta di farmaci più efficiente e, in ultima analisi, allo sviluppo di nuove terapie per i pazienti.

Può spiegarci in che modo le reti neurali addestrate su Regole scritte da programmatori esperti contribuiscono a raggiungere una maggiore precisione di sintesi nella pianificazione retrosintetica?

Le reti neurali addestrate su regole di reazione codificate da esperti possono migliorare l'accuratezza delle previsioni sintetiche nella pianificazione retrosintetica, incorporando conoscenze chimiche dettagliate e rimanendo sufficientemente flessibili per affrontare reazioni incomplete o nuove.

Le Regole scritte da programmatori esperti sono un insieme di regole chimiche predefinite che descrivono trasformazioni chimiche note. Queste regole si basano su anni di ricerca e conoscenza del dominio e possono essere utilizzate come base per l'addestramento delle reti neurali. Addestrando le reti neurali su queste regole, le reti possono imparare a riconoscere i modelli di reazione e a prevedere meglio i risultati delle trasformazioni chimiche.

L'uso di reti neurali addestrate su Regole scritte da programmatori esperti può anche aiutare ad affrontare la sfida delle reazioni incomplete o nuove. Ad esempio, se una trasformazione chimica è stata osservata in precedenza solo in un insieme limitato di reazioni, la rete neurale può essere addestrata a prevedere l'esito di tale trasformazione sulla base dei dati disponibili e delle regole dell'esperto. Ciò è particolarmente utile nel contesto della scoperta di farmaci, dove molte molecole target non sono mai state sintetizzate prima.

Incorporando conoscenze chimiche dettagliate sotto forma di Regole scritte da programmatori esperti, le reti neurali addestrate su queste regole possono raggiungere una maggiore precisione nella pianificazione retrosintetica. Questo non solo aiuta i chimici a prevedere con maggiore precisione i risultati delle reazioni chimiche, ma accelera anche il processo di scoperta dei farmaci, assistendo i chimici nell'identificazione delle vie sintetiche ottimali per i nuovi composti.

Come si fa a sfruttare una libreria di reazioni chimiche e metadati per progettare sintesi sostenibili?

Questo è un aspetto importante del lavoro futuro. Il bello della retrosintesi computazionale è che si possono demeritare i protocolli che utilizzano reagenti insensibili all'ambiente, per esempio le reazioni che richiedono il diclorometano come solvente o che producono una grande quantità di rifiuti metallici. Nel frattempo, si possono premiare i protocolli che sfruttano opzioni più ecologiche.

Un modo per farlo è incorporare nella libreria informazioni sull'impatto ambientale di specifiche reazioni chimiche. È possibile codificare una serie di fattori come la quantità di rifiuti generati, l'energia richiesta e la tossicità dei reagenti. Ciò consente ai chimici di identificare vie sintetiche sostenibili per le molecole target, selezionando dalla libreria le reazioni che soddisfano i criteri di sostenibilità richiesti.

Oltre alle informazioni sull'impatto ambientale di specifiche reazioni chimiche, i metadati sulle reazioni chimiche possono essere utilizzati per progettare sintesi sostenibili. Questi metadati possono includere informazioni come le rese di reazione, i solventi utilizzati e i requisiti energetici. Analizzando questi metadati, i chimici possono identificare vie sintetiche più efficienti e sostenibili.

Sfruttando una libreria di reazioni chimiche e metadati per progettare sintesi sostenibili, i chimici possono ridurre l'impatto ambientale dei processi di sintesi, portando a un'industria chimica più sostenibile e meno dispendiosa. Inoltre, selezionando le reazioni da una libreria di reazioni sostenibili, i chimici possono anche migliorare la velocità e il rapporto costo-efficacia del processo di scoperta dei farmaci, portando a trattamenti più accessibili e convenienti per i pazienti.

Nel contesto della sintesi organica guidata dall'intelligenza artificiale, come si possono accoppiare algoritmi di IA e piattaforme robotiche?

L'accoppiamento di algoritmi di IA e piattaforme robotiche nella sintesi organica guidata dall'intelligenza artificiale potrebbe migliorare significativamente la velocità e l'efficienza del processo di scoperta. La sintesi organica guidata dall'intelligenza artificiale automatizza la logica della sintesi, mentre le piattaforme robotiche automatizzano il lavoro pratico in laboratorio: si tratta quindi di una combinazione potente.

Gli algoritmi di intelligenza artificiale possono essere utilizzati per prevedere le vie sintetiche ottimali per una determinata molecola target, sfruttando vasti database di reazioni chimiche e dati correlati. Le piattaforme robotiche possono quindi essere utilizzate per sintetizzare la molecola target sulla base dei percorsi previsti. L'uso di queste piattaforme consente una sperimentazione rapida e la sintesi High-Throughput di un gran numero di composti.

La combinazione di algoritmi di intelligenza artificiale e piattaforme robotiche può essere ulteriormente migliorata utilizzando meccanismi di feedback loop per ottimizzare il processo di sintesi in tempo reale. Ad esempio, un algoritmo di intelligenza artificiale potrebbe monitorare il processo di sintesi e fornire un feedback sulle condizioni di reazione, portando a un'ulteriore ottimizzazione del percorso sintetico e, in definitiva, a risultati migliori.

Un altro modo in cui gli algoritmi di IA e le piattaforme microfluidiche robotiche possono essere accoppiati è l'uso di algoritmi di apprendimento automatico per migliorare le prestazioni della piattaforma microfluidica. Attraverso il monitoraggio continuo e il feedback, gli algoritmi di apprendimento automatico possono imparare a prevedere le condizioni di reazione ottimali e migliorare l'efficienza e l'accuratezza della piattaforma microfluidica.

In definitiva, combinando la potenza degli algoritmi di intelligenza artificiale e delle piattaforme microfluidiche robotiche, il processo di scoperta dei farmaci può essere accelerato, consentendo la rapida identificazione di nuovi candidati farmaci. Questo ha il potenziale per migliorare significativamente i risultati dei pazienti, fornendo trattamenti più rapidi ed efficaci per un'ampia gamma di malattie.

L'aspetto entusiasmante è che la robotica di laboratorio sta diventando sempre più accessibile a tutti, attraverso fornitori commerciali o piattaforme hardware open-source democratizzate. Il settore è destinato ad accelerare ulteriormente, dato che l'automazione di laboratorio sta assumendo un ruolo sempre più importante nella formazione dei programmi di laurea e di specializzazione, preparando la prossima generazione di ricercatori a questo futuro lavorativo.

In che modo l'automazione di laboratorio ha trasformato la sintesi tradizionale e quali sono i principali vantaggi che offre rispetto alle operazioni manuali?

L'automazione di laboratorio ha trasformato la sintesi tradizionale consentendo una sperimentazione High-Throughput e una sintesi più rapida e precisa di composti organici complessi. Alcuni dei principali vantaggi che offre rispetto alle operazioni manuali includono una maggiore efficienza, una maggiore precisione, una migliore riproducibilità, la capacità di gestire materiali pericolosi e l'integrazione con l'intelligenza artificiale e gli algoritmi di apprendimento automatico.

L'automazione consente la sintesi rapida e riproducibile di un gran numero di composti, riducendo il tempo e gli sforzi necessari per le attività chimiche di routine e liberando gli scienziati per concentrarsi su ricerche più complesse. Le apparecchiature automatizzate sono in grado di erogare volumi precisi di reagenti, riducendo la variabilità dei risultati delle reazioni e migliorando l'accuratezza dei risultati, e possono gestire in modo sicuro materiali e reazioni pericolose, proteggendo i ricercatori da sostanze chimiche potenzialmente dannose.

L'automazione garantisce che gli esperimenti vengano eseguiti in condizioni coerenti, riducendo la probabilità di errore umano e aumentando la riproducibilità dei risultati. Può essere integrata con l'intelligenza artificiale e gli algoritmi di apprendimento automatico per ottimizzare ulteriormente le operazioni di laboratorio e accelerare lo sviluppo di nuovi composti.

Nel complesso, l'automazione di laboratorio ha il potenziale per migliorare significativamente l'efficienza e la precisione della sintesi tradizionale, portando a una più rapida scoperta di farmaci e, in ultima analisi, a trattamenti più efficaci per i pazienti.

Quali sono le prospettive del futuro dell'automazione sintetica e come immagina la progressione dai processi ad alta intensità di lavoro all'automazione intelligente?

Il futuro dell'automazione sintetica dovrebbe essere caratterizzato da continui progressi nella robotica, nell'apprendimento automatico e nell'intelligenza artificiale, che porteranno a sistemi di automazione sempre più sofisticati e intelligenti.

Una delle aree chiave dell'automazione sintetica futura sarà lo sviluppo di laboratori autonomi in grado di operare 24 ore su 24, 7 giorni su 7, senza l'intervento umano. Questi sistemi saranno dotati di robotica e algoritmi di apprendimento automatico in grado di svolgere attività di routine, monitorare gli esperimenti e prendere decisioni autonome sulla base dei dati generati.

Un'altra area di interesse sarà l'ulteriore integrazione dell'intelligenza artificiale nel processo di scoperta dei farmaci. Ciò comporterà lo sviluppo di algoritmi di intelligenza artificiale in grado di analizzare grandi quantità di dati chimici, prevedere gli esiti delle reazioni chimiche e ottimizzare le condizioni sperimentali in tempo reale.

Nel corso del tempo, si prevede che l'automazione sintetica diventerà sempre più intelligente, con i sistemi di automazione che assumeranno compiti sempre più complessi e genereranno nuove intuizioni in grado di accelerare la scoperta di farmaci. Questi sistemi altamente automatizzati permetteranno ai ricercatori di eseguire un'ampia gamma di esperimenti con una manodopera e una supervisione umana minime, portando a uno sviluppo di farmaci più rapido ed efficiente.

In generale, la traiettoria dell'automazione sintetica è verso sistemi più intelligenti e sofisticati, in grado di gestire esperimenti complessi e di generare rapidamente grandi quantità di dati che possono essere utilizzati per ottimizzare ulteriormente il processo di scoperta dei farmaci. In futuro, possiamo aspettarci di assistere a una progressione da processi ad alta intensità di lavoro a sistemi intelligenti e altamente automatizzati che possono rivoluzionare la scoperta di farmaci e portare a nuovi trattamenti per un'ampia gamma di malattie.

Considerando le intuizioni di questi articoli e i progressi nella retrosintesi assistita da computer, come vede la continua integrazione dell'intelligenza artificiale e dell'automazione nel panorama della sintesi chimica negli anni a venire?

Si prevede che la continua integrazione dell'intelligenza artificiale e dell'automazione plasmerà drammaticamente il panorama della sintesi chimica in futuro. Si prevede che l'intelligenza artificiale e l'automazione accelereranno la scoperta di farmaci, consentendo ai chimici di sintetizzare i composti in modo più rapido ed efficiente. Ciò consentirà ai ricercatori di testare un numero maggiore di molecole e di esplorare una gamma più ampia di spazi chimici. L'integrazione dell'IA e dell'automazione può anche contribuire a ridurre l'impatto ambientale della sintesi chimica, consentendo ai ricercatori di identificare percorsi chimici più sostenibili.

Gli algoritmi di IA con la sintesi automatizzata possono ridurre l'errore umano e portare a una sintesi più precisa, ottenendo così prodotti di qualità superiore. Accelererà l'esplorazione dello spazio chimico nella scoperta dei farmaci e porterà all'identificazione di nuovi composti che altrimenti sarebbero difficili da scoprire con i metodi tradizionali. L'integrazione dell'IA e dell'automazione nella sintesi chimica ha il potenziale per trasformare il settore in modo profondo, accelerando notevolmente la velocità e l'efficienza della scoperta di farmaci e migliorando contemporaneamente la nostra capacità di identificare molecole farmacologiche sostenibili ed efficaci. Il futuro della sintesi chimica si prospetta luminoso con la continua integrazione di queste tecnologie.

Divulgazione: il laboratorio Cernak ha ricevuto finanziamenti per la ricerca o donazioni in natura da MilliporeSigma, Burlington, MA, un'affiliata di Merck, Relay Therapeutics, Janssen Therapeutics, SPT Labtech e MSD Inc. T.C. detiene partecipazioni in Scorpion Therapeutics ed è cofondatore e azionista di Iambic Therapeutics.