White Paper:
Sintesi organica guidata dall'intelligenza artificiale: sulla strada della sintesi autonoma?

Adattato da
C. Empel, R. M. Koenigs, Angew. Chem. Int. Ed. 2019, 58, 17114. https://doi.org/10.1002/anie.201911062
Pubblicato per gentile concessione di Wiley.
La creatività e la disciplina meticolosa dei chimici organici hanno permesso la sintesi organica di molecole complesse per decenni e la loro sintesi è spesso definita "l'arte della sintesi". Gli algoritmi di intelligenza artificiale vengono sviluppati e perfezionati non solo per eseguire ricerche in letteratura e analisi retrosintetiche, ma anche per identificare e classificare potenziali vie di sintesi che includono le condizioni di reazione. Embel e Koenigs esaminano un recente articolo di Science che combina lo sviluppo di piani di sintesi per piccole molecole guidato dall'intelligenza artificiale (IA) con un processo di sintesi automatizzato sviluppato dall'IA. Ne discutono anche i limiti e mettono in evidenza le innovazioni future per migliorare i vantaggi della sintesi organica guidata dall'intelligenza artificiale.
Introduzione
Tradizionalmente, la sintesi totale di molecole complesse, compresa la sintesi organica, implica creatività, una valutazione meticolosa di ogni fase per ottenere il prodotto desiderato e un processo ripetitivo per modificare le reazioni in base a specifiche proprietà biochimiche o biologiche (ad esempio, biodisponibilità, solubilità) e ottimizzare le rese. L'IA viene utilizzata per proporre metodologie di reazione come nuovi percorsi per la sintesi di composti. Empel e Koenigs suggeriscono che il prossimo passo evolutivo dell'IA sarà la sintesi multistep automatizzata di molecole complesse. Sebbene simili, la sintesi automatizzata e quella autonoma si differenziano per la necessità di un contributo umano. Nella sintesi automatica è necessario l'intervento umano per definire soglie, limiti, parametri di reazione e protocolli di sintesi nei file di reazione. In confronto, la sintesi autonoma è un processo sintetico autogestito che si adatta ai parametri circostanti, come la stereoselettività e la resa di reazione, senza l'intervento umano.
Limitazioni dell'analisi retrosintetica tradizionale e della sintesi automatica
Senza il supporto dell'intelligenza artificiale, i chimici possono facilmente perdere le combinazioni pertinenti di nuovi substrati, l'Ottimizzazione della reazione, la progettazione di catalizzatori migliorati e di nuove reazioni nella letteratura chimica in rapida espansione. Tutte le discipline delle scienze chimiche considerano la sintesi di piccole molecole come un collo di bottiglia e la sintesi automatizzata su richiesta può aiutare a superare questa sfida.
I composti scarsamente solubili rappresentano un'ulteriore sfida nei flussi di lavoro automatizzati e spesso richiedono un maggiore intervento umano per migliorare il processo a causa dell'intasamento dei canali. Le previsioni sulla solubilità dei reagenti nel piano di sintesi proposto rimangono limitate e ciò ostacola l'esecuzione di alcune vie sintetiche. Le reazioni che richiedono o producono temperature sub-ambientali di solito richiedono anche la consulenza di un chimico esperto per mantenere un flusso di lavoro efficiente. Dopo la sintesi automatizzata, per il composto finale sarà necessaria una purificazione in batch, che potrebbe richiedere attrezzature speciali come colonne particolari.
AI - Pianificazione dei percorsi di sintesi e sintesi automatizzata
Embel e Koenigs riassumono il recente articolo di Jamison e Jensen e dei loro colleghi [1]. Essi hanno combinato la pianificazione della sintesi assistita da computer e un apparato di flusso riconfigurabile roboticamente per fornire la sintesi su richiesta di piccole molecole (50-750 g/mole), come riassunto nella Figura 1. Il sistema richiede ancora l'input umano per integrare l'algoritmo di sintesi AI con considerazioni pratiche (ad esempio, scelte precise di stereochimica e solventi) che aiutano a ottimizzare il processo di sintesi multistep.

L'intelligenza artificiale apprende i principi di progettazione da una ricerca in letteratura su banche dati che includono reazioni di retrosintesi e reazioni di composti correlati per progettare una o più vie sintetiche. I piani proposti includono le condizioni di reazione, i precursori, gli enzimi (se necessari), i catalizzatori, i substrati, i precursori e i sottoprodotti in ogni fase. AI fornisce anche una stima della fattibilità di ogni piano di sintesi proposto, in modo che i chimici possano scegliere il piano più appropriato per l'automazione, spesso in microfluidica, con l'intenzione di scalare il processo. Dopo che l'IA ha sviluppato un piano di sintesi in silico a partire dalle banche dati delle reazioni e dei composti, i chimici utilizzano le loro conoscenze esperte di sintesi per perfezionare i file delle ricette chimiche e le configurazioni sperimentali e della piattaforma. I chimici adattano i file delle ricette per superare eventuali inadeguatezze dei sistemi di flusso microfluidici prima di utilizzarli in una baia chimica nel sistema automatizzato. In questo modo, l'input dei chimici facilita l'implementazione robotica della sintesi multistep proposta, che rappresenta un passo importante verso la sintesi scalabile.
Jamison, Jensen e colleghi hanno utilizzato questa strategia per prevedere le vie di sintesi de novo di 15 piccole molecole, modificare i relativi file di ricetta e automatizzarne la sintesi utilizzando workflow microfluidici [1]. I 15 composti comprendono l'antinfiammatorio non steroideo (FANS) celecoxib, l'anticoagulante warfarin e il prodrug dell'ACE inibitore quinapril. La Figura 2 (pannello superiore) mostra il processo di sintesi dell'antinfiammatorio non steroideo (FANS) celecoxib (struttura 1). I primi due banchi di reazione controllati da robot hanno condotto la condensazione di Claisen del 4-metilacetofenone (2) con il trifluoroacetato di metile (3). Un altro vano di reazione controllato da robot ha condotto la condensazione finale dell'intermedio con l'idrazina (4), ottenendo il celecoxib.

Jamison, Jensen e colleghi hanno applicato la tecnologia guidata dall'intelligenza artificiale per sviluppare piani di sintesi ed eseguire la sintesi di diversi ACE-inibitori e di numerosi analoghi del celecoxib [1]. La resa delle piccole molecole variava da 342 mg/h a 572 mg/h.
Il piano di sintesi proposto dall'AI per il bezafibrato utilizzava una reazione di Bargellini che coinvolgeva acetone, cloroformio e fenolo (6). Tuttavia, durante il tentativo di sintesi del bezafibrato (Fig. 2 compound 5) mediante microfluidica, si sono verificate temperature subambientali. Jamison, Jensen e colleghi hanno dimostrato la fattibilità del piano sintetico proposto da AI eseguendo un processo di sintesi manuale separato. La resa è stata del 76%.
Miglioramenti futuri
Diversi gruppi stanno lavorando per migliorare l'analisi e la previsione della stereochimica guidata dall'IA e i metodi per favorire la struttura stereochimica desiderata nella sintesi proposta. Questo miglioramento potrebbe ridurre l'apporto umano necessario per le modifiche e l'uso dei file delle ricette chimiche.
In futuro, l'IA potrebbe anche essere in grado di proporre schemi di purificazione continua o sistemi di purificazione in batch per fornire un composto target relativamente puro. L'aggiunta di analisi di reazione online potrebbe fornire informazioni importanti sull'andamento della reazione e consentire agli algoritmi di feedback di modificare i parametri di reazione in tempo reale, migliorando potenzialmente l'efficienza e la resa.
Sintesi
Jamison, Jensen e colleghi hanno descritto la loro sintesi on-demand guidata dall'intelligenza artificiale di piccole molecole (50-750 g/mole) combinando la pianificazione della retrosintesi assistita dal computer con file di reazione raffinati dal chimico che indirizzano un apparato di flusso riconfigurabile roboticamente [1]. Questa strategia è stata utilizzata per prevedere le vie di sintesi de novo di 15 piccole molecole, modificare i relativi file di ricetta e automatizzarne la sintesi mediante flussi di lavoro microfluidici. I 15 composti comprendono l'antinfiammatorio non steroideo (FANS) celecoxib, l'anticoagulante warfarin e il prodrug dell'ACE inibitore quinapril. Embel e Koenigs hanno discusso le limitazioni, come la scarsa solubilità di uno o più componenti e i composti target che richiedono una stereochimica specifica. Hanno inoltre suggerito di espandere i piani proposti guidati dall'intelligenza artificiale per includere schemi di purificazione e/o analisi delle reazioni in-processo per automatizzare ulteriormente il processo di sintesi. Questi miglioramenti potrebbero dirottare il lavoro di sintesi e ottimizzazione di routine verso i robot, in modo che i chimici possano dedicarsi maggiormente ai progetti di ricerca guidati dalla curiosità, al monitoraggio e all'analisi approfondita delle reazioni e alle scoperte serendipiche.
Riferimenti
[1] Coley, C.W. et al. (2019). Una piattaforma robotica per la sintesi a flusso di composti organici informata dalla pianificazione AI. Science.DOI: 10.1126/science.aax1566.