白皮书:
合成自动化:从石器时代到现代的革命

改编自
Fang, G., Lin, D.-Z. 和 Liao, K. (2023),《合成自动化》:从 "石器时代 "到现代的革命》。Chin.https://doi.org/10.1002/cjoc.202200713
由 Wiley 惠供出版。
传统的有机合成虽然取得了突出的进展,但手工操作、不稳定的重现性和不充分的效率阻碍了其向智能自动化的可靠发展。合成化学正开始采用人工智能(AI)软件来取代劳动密集型流程,如研究开发潜在的合成路线、确定反应试剂与排序选择推定的有机合成设计和自动合成。在此,Liao 及其同事重点介绍了自动化合成领域的一些代表性突破,并介绍了该领域当前面临的挑战和未来的发展方向。
背景
18 世纪和 19 世纪的工业革命见证了自动化制造的力量。有机合成一直依赖于训练有素的劳动力(化学家)来创造和执行分子合成过程。20 世纪 60 年代,Merrifield 报告了有机化学领域的首个自动化系统:通过将 C 端附着在树脂上并用保护基团遮蔽 N 端来进行固相肽合成。自动化装置泵入相关试剂和溶剂,将其与树脂混合,并按正确顺序移除,以实现脱保护、酰化、分离和纯化。
在大多数情况下,有机合成仍然是一个非常耗时耗力的过程,由于不同实验室和设备的技术不同,结果也不尽相同。在这一新兴主题中,Fang 及其同事重点介绍了最近的几项突破,如人工智能驱动的研究、人工智能辅助的合成设计以及实际合成过程中的人工智能集成机器人自动化。此外,还介绍了自动化合成路线的设计和实施所面临的挑战。
突破性进展
许多药物都是化学结构多样的小分子,因此需要定制化程序,这既耗费资金,又需要训练有素的劳动力。伯克开发了迭代碳二维和三维钴催化剂(C-Csp2、C-Csp3)组装策略,并将该过程自动化,合成了 14 种不同类别的小分子。四甲基 N-亚甲基二乙酸(TIDA)的使用支持了 C-Csp3 键的形成。这种合成机器与 5000 多种商业合成砌块相结合,可支持合成众多小分子。
流式合成平台可精确控制反应温度、反应时间和成分,在自动化合成中发挥重要作用。例如,Li 和 Pentelute等 人发明的快速流动装置 Tiny Tides 可以高效生产细胞穿透肽-共轭肽核酸[1]。2020 年,Mo等 人在其自动化微流体单液滴筛选和分析平台上进行高通量实验,加速了新型电有机过程的发现[2]。2022 年,Wang等人 设计了一个电催化剂测试平台:它在 55 小时内对 109 种铜基双金属催化剂进行了 942 次有效测试[3]。
Gilmore 及其同事开发了一种自动多步合成装置,通过在中央核心周围布置多个连续流模块,可稳定、可重现地提供线性和收敛合成过程[4]。从一个模块切换到另一个模块无需手动配置。该仪器还包括核磁共振(NMR)和红外光谱(IR)在线监测:监测有助于反应后分析和反馈。他们通过合成抗癫痫药物鲁非那胺的衍生物库,展示了径向流配置的灵活性。
Mo 的研究小组介绍了一个自动平台,该平台在 2022 年通过在线薄层色谱(TLC)收集极性估计值[5]。训练有素的人工智能平台可以估计多种化合物的分离概率,并帮助提出纯化条件。
为了尽量减少对人类化学家输入的需求,克罗宁研究小组(2019 年)开发了 Chemputer,该系统可为各个步骤提供方法指导,并利用自然语言处理(NLP)算法将平台自动化与台架规模技术整合在一起[6]。Chemputer 系统可以从出版物中提取合成程序,将合成设计转化为程序所用的化学描述语言,将指令转化为操作自动化平台的命令,并指导化学合成。在没有人工干预的情况下,Chemputer 组装出了三种高质量的药品,其产量和纯度均高于人工合成和纯化程序中的产量和纯度 Coley等 人[7]完成了有机化学合成自动化的一个里程碑。他们的计算机辅助化学合成程序包括基于数百万个已发表的化学反应的合成设计,以及为最大限度地提高成功率而进行的硅学模拟。人工智能合成程序指导着一个模块化连续流平台,该平台通过自动重新配置机械臂来执行合成。通过规划和合成 15 种化合物,包括几种血管紧张素转换酶 (ACE) 抑制剂和非甾体抗炎药,证明了它的强大功能。
Grzybowski 和 Burke等人 介绍了一种迭代机器学习系统,用于探索拟议自动合成方案中的一般反应条件[8]。一个简单的闭环工作流程利用机器学习的数据引导矩阵来优先选择后续反应进行测试,并利用机器人实验来增强精确度、吞吐量和可重复性。其工作流程通过实验和机器学习确定了杂(芳基)Suzuki-Miyaura 偶联反应的反应条件,这证实了其对多维化学优化难题的实用性。
库珀的研究小组介绍了首个人工智能集成移动机器人,该机器人在八天内自主运行了 688 个反应,对十个变量进行了彻底的实验测试[9]。然而,该机器人不具备捕捉现有化学知识的软件能力,也不具备生成新科学假设的机器学习能力。
Jiang 课题组(2022 年)描述了一个名为 AI-Chemist 的人工智能平台,该平台可以完成合成设计的提出和排序、合成步骤的执行、通过多个反应和步骤对合成过程进行监控和数据收集以及机器学习等基本步骤(图 1)[10]。

挑战与展望
自动和自主人工智能驱动的有机合成平台已经取得了很大进展。然而,如果能解决以下挑战,就能加快其广泛应用。
无缝集成自动合成平台,该平台包含试剂储存模块、反应制备模块、多个反应器模块、用于监控反应的集成分析仪器、纯化系统、化合物管理系统、监控单元和控制台。由于大多数实验室空间有限,仪器和平台的大小最好不超过通风橱。计算机辅助或人工智能驱动的合成设计算法应与计算机辅助化学合成(CASP)平台和监控设备无缝集成。
物理平台和软件应易于定制和重新配置,以适应未来的用途。
全套设备的价格应合理(低廉),因为许多实验室会以类似的成本聘请真正的化学家,而不是自动化设备。
自动化平台和软件必须对用户友好:在设置和优化合成规划/排序以及选择和执行合成过程方面简单明了。使用通用化学程序语言供化学家输入和检索数据,将有助于最大限度地发挥人类化学家的优势。
随着有机化学合成自动化应用的扩大,有机化学家将从优化过程中经常使用的重复实验中解脱出来。有机化学家将能把更多时间放在回答 "我们应该合成什么?为什么?"的问题,而不是实际合成过程中的机械问题。
摘要
多个研究小组正在推进人工智能驱动的有机化学合成,将机器学习与自动提出和实验测试有前景的新合成路线相结合,而无需人工输入。自动合成可以可靠地提高产量,并将化学家从常规手工任务中解放出来,使他们可以专注于创造性任务。
参考文献
[1] Li, C.et al. (2022)。多肽-PNA 共轭物的自动流式合成。ACS Central Science. DOI: 10.1021/acscentsci.1c01019.
[2] Mo, Y.et al. (2020).电有机化学高通量实验的多功能微流控平台。Angewandte Chemie - International Edition. DOI: 10.1002/ anie.202009819.
[3] Xie, M.et al. (2022).铜基双金属电催化剂的快速筛选:镁改性铜上 CO2 到 C2+ 产品的高效电催化还原。Angewandte Chemie - International Edition. DOI: 10.1002/anie.202213423.
[4] Chatterjee, S.et al. (2020).有机分子的自动径向合成。自然》。 DOI: 10.1038/s41586-020- 2083-5.
[5] Xu, H.et al. (2022).结合自动化和机器学习技术的化学结构-极性关系高通量发现。Chem. DOI: 10.1016/j.chempr.2022.08.008.
[6] Steiner, S.et al. (2019).由化学编程语言驱动的模块化机器人系统中的有机合成。科学》。 DOI: 10.1126/science.aav2211.
[7] Coley, C.W.et al. (2019).基于人工智能设计的有机化合物流式合成机器人平台。Science. DOI: 10.1126/science.aax1566.
[8] Angello, N.H. et al. (2022).杂芳基铃木-宫浦偶联通用反应条件的闭环优化。Science.DOI:10.1126/science. adc8743.
[9] Burger, B.等 (2020).移动机器人化学家。自然》。 DOI: 10.1038/s41586- 020-2442-2.
10]Zhu, Q.et al. (2022).具有科学头脑的全能人工智能化学家。国家科学评论》。 DOI: 10.1093/ nsr/nwac190.