白皮书:
利用计算机辅助合成设计开启未来化学之路

Tim Cernak 教授访谈
我们有幸采访了密歇根大学药物化学助理教授 Tim Cernak 教授,他的研究兴趣广泛,涉及化学合成、自动化、数据科学等领域。凭借十多年的经验,Cernak 教授一直站在该领域变革的最前沿。在这次访谈中,我们将深入探讨计算机辅助合成设计(CASP)的世界,这是一个利用自动化、计算分析和人工智能来简化化学合成装置的领域。Cernak 教授将讨论 CASP 的关键作用、从基于规则的程序到机器学习的演变,以及人类专业知识与人工智能之间的协同作用。我们将探讨神经网络和专家编码的反应规则如何提高合成的准确性,并讨论最近取得的突破,如利用工业废料进行可持续合成。此外,我们还将揭示人工智能驱动的有机合成的潜力,并探讨未来的前景。请加入我们与 Tim Cernak 教授的对话,共同探索 CASP、实验室自动化以及合成化学智能自动化的美好未来。

Timothy Cernak 教授
药物化学和化学助理教授
Tim Cernak 于 1980 年出生于加拿大蒙特利尔。他在不列颠哥伦比亚大学奥肯那根分校获得化学学士学位,并在那里研究霞多丽葡萄酒的香气特征。在麦吉尔大学师从吉姆-格里森(Jim Gleason)教授接受全合成博士培训后,蒂姆在哥伦比亚大学师从特里斯坦-兰伯特(Tristan Lambert),担任 FQRNT 博士后研究员。2009 年,Tim 加入了位于新泽西州拉威的默克夏普公司的药物化学团队。在那里,他开发了微型合成和后期功能化技术。2013 年,Tim 调往默克公司波士顿生产基地工作。2018 年,Cernak 博士加入密歇根大学安娜堡分校的药物化学系,担任助理教授。Cernak 实验室正在探索化学合成和数据科学的一个接口。蒂姆是 Entos 公司的联合创始人。
在计算机辅助合成设计领域,CASP 在整合人类直觉和计算能力方面发挥着怎样的作用?
计算机辅助合成设计(CASP)是一个发展迅速、历史悠久的领域。CASP 系统旨在通过提出符合特定标准(如产量、成本和安全性)的合成路线来帮助化学家进行决策。
也许与其他任何科学领域相比,全合成更能体现和颂扬其工艺的艺术性和优雅性。该领域将多年来在战略规划、发达的逻辑系统以及创新和新颖的实验反应模式等方面的发展提炼成一系列计划好的反应步骤。越来越多的化学反应及其相关的规则和机制是人类无法记住的。但有趣的是,它们却遵循游戏的所有规则,并可以编码到计算机中。这种逻辑将人类的决策过程、专家知识和化学直觉与机器学习模型和算法的计算能力相结合,从而生成高效的合成路线。
,在合成规划的计算分析方面,您能否重点介绍一下从基于规则的程序到机器学习的发展过程?
当然,一开始基于规则的程序依赖于人工策划的化学反应和官能团转化集来生成合成路线。这些方法涉及对反应规则的人工整理,虽然提供了专家级的背景,但却限制了可考虑的规则数量,尤其是随着原始文献中新反应规则报告的速度加快。最近,机器学习 (ML) 方法已成为化学合成设计的有力工具,因为它们可以整合大量的化学反应数据集。
。
在小分子合成中使用人工智能算法提出合成路线有哪些重要里程碑和意义?
现代合成算法已开始超越显而易见的范畴,向更复杂的合成挑战迈进。早期的 CASD 可以遵循有机化学规则,但答案与显而易见的答案相去不远。随着可供考虑的反应库不断增加,更多新颖的建议也开始出现。计算机设计路线的实验验证终于变得越来越流行,其中一些重要的里程碑包括在机器人平台上全自动执行、通过计算机设计路线生成与人类设计路线无异的复杂天然产品,以及通过人机合作得出特别简短的合成配方以获得天然产品。合并后的高通量实验技术是一个令人兴奋的新领域,有望进一步加快药物发现过程。随着越来越多的系统采集和机器可读反应数据的出现,机器学习的预测能力也将得到提高。未来,我们很可能会看到更多基于物理学的预测被编码到逆合成计算中。
专家和机器学习方法在改进逆合成规划方面的协同作用是什么?
在逆合成规划中,目标是通过从目标分子逆推到更简单的起始原料,确定目标分子的最佳合成路线。专家方法和机器学习(ML)方法可结合使用,以提高逆向合成规划的有效性。
专家方法依靠人类化学家的知识和经验来确定合成中的关键步骤。这些方法通常基于多年研究形成的一套人工编辑的化学规则。虽然这些专家方法很有价值,但它们受限于使用人工编辑的规则所能描述的转化范围和复杂性。
另一方面,ML 方法可以分析已知化学反应的大型数据集,并自动学习专家方法难以或无法捕捉的模式和化学转化。ML 算法识别这些新模式和转换的能力可以增强人类化学家的领域知识和直觉。
在逆合成规划中,专家方法和 ML 方法之间的协同作用体现在专家指导的 ML 算法的开发中。在这些方法中,专家知识用于指导选择由 ML 模型生成的潜在合成路线。这样既能提高合成路线选择的准确性和特异性,又能受益于 ML 算法的效率和规模。
总的来说,在逆合成规划中结合专家和 ML 方法有可能显著提高这一过程的速度和效率,从而提高药物发现的效率,最终为患者开发出新的疗法。
。
您能否详细说明根据专家编码的反应规则训练的神经网络如何有助于在逆合成规划中实现更高的合成精度?
根据专家编码反应规则训练的神经网络可以提高逆向合成规划中合成预测的准确性,因为它既包含了详细的化学知识,又能保持足够的灵活性以应对不完全反应或新反应。
专家编码的反应规则是一组预定义的化学规则,用于描述已知的化学转化。这些规则基于多年的研究和领域知识,可用作训练神经网络的基础。通过在这些规则上训练神经网络,网络可以学习识别反应模式,更好地预测化学转化的结果。
使用根据专家编码的反应规则训练的神经网络,还有助于应对不完全反应或新型反应的挑战。例如,如果以前只在有限的一组反应中观察到某种化学转化,则可以根据现有数据和专家规则对神经网络进行训练,以预测该转化的结果。这在药物发现方面尤其有用,因为许多目标分子以前从未被合成过。
通过以专家编码规则的形式纳入详细的化学知识,根据这些规则训练的神经网络可以在逆合成规划中实现更高的准确性。这不仅能帮助化学家更准确地预测化学反应的结果,还能协助化学家确定新化合物的最佳合成路线,从而加快药物发现过程。
。
如何利用化学反应库和元数据来设计可持续合成?
这是未来工作的一个重要方面。计算逆合成的优点在于,您可以对使用对生态不敏感试剂的方案进行扣分,例如需要二氯甲烷作为溶剂或产生大量金属废物的反应。与此同时,您可以奖励那些使用更环保试剂的方案。
这样做的一种方法是将特定化学反应对环境影响的信息纳入化学库。可以对产生的废物量、所需能量和试剂毒性等各种因素进行编码。这样,化学家就可以从反应库中选择符合可持续发展标准的反应,从而为目标分子确定可持续的合成路线。
除了特定化学反应对环境影响的信息外,关于化学反应的元数据也可用于设计可持续合成。这些元数据可包括反应产率、所用溶剂和能源需求等信息。通过分析这些元数据,化学家可以找出更高效、更可持续的合成路线。
通过利用化学反应库和元数据来设计可持续合成,化学家可以减少合成过程对环境的影响,从而实现更可持续、浪费更少的化学工业。此外,通过从可持续反应库中选择性反应,化学家还可以提高药物发现过程的速度和成本效益,从而为患者提供更方便、更实惠的治疗方法。
。
在人工智能驱动的有机合成方面,如何将人工智能算法和机器人平台耦合在一起?
在人工智能驱动的有机合成中,人工智能算法和机器人平台的耦合可以显著提高发现过程的速度和效率。人工智能驱动的有机合成是合成逻辑的自动化,而机器人平台则是实验室实践工作的自动化,因此这是一个强大的组合。
人工智能算法可以利用庞大的化学反应数据库和相关数据,预测特定目标分子的最佳合成路线。然后,机器人平台可根据预测路线合成目标分子。使用这些平台可以快速实验和高通量合成大量化合物。
通过使用反馈回路机制实时优化合成过程,人工智能算法与机器人平台的结合可以得到进一步加强。例如,人工智能算法可以监控合成过程并提供反应条件反馈,从而进一步优化合成路线,最终获得更好的结果。
人工智能算法与机器人微流控平台结合的另一种方式是使用机器学习算法来提高微流控平台的性能。通过持续监测和反馈,机器学习算法可以学会预测最佳反应条件,提高微流控平台的效率和准确性。
最终,通过结合人工智能算法和机器人微流体平台的力量,可以加速药物发现过程,从而快速确定新型候选药物。这有可能为各种疾病提供更快、更有效的治疗方法,从而大大改善患者的预后。
令人兴奋的是,通过商业供应商或开源民主化硬件平台,实验室机器人技术正变得越来越普及。随着实验室自动化在本科生和研究生教育中发挥越来越大的作用,这一领域必将进一步加速发展,为下一代研究人员未来的工作做好准备。
实验室自动化是如何改变传统合成的?与人工操作相比,它有哪些主要优势?
实验室自动化改变了传统的合成方法,实现了高通量实验以及更快、更精确地合成复杂的有机化合物。与人工操作相比,它具有的一些主要优势包括:更高的效率、更高的精度、更好的可重复性、处理危险材料的能力以及与人工智能和机器学习算法的集成。
自动化可以快速、可重复地合成大量化合物,减少常规化学任务所需的时间和精力,让科学家腾出手来专注于更复杂的研究。自动化设备可以精确分配试剂量,从而减少反应结果的变异性,提高结果的准确性,并能安全处理危险材料和反应,保护研究人员免受潜在有害化学物质的伤害。
自动化可确保实验在一致的条件下进行,减少人为失误的可能性,提高结果的可重复性。它可以与人工智能和机器学习算法相结合,进一步优化实验室操作,加快新化合物的开发。
总体而言,实验室自动化有可能显著提高传统合成的效率和精确度,从而加快药物发现,最终为患者提供更有效的治疗。
合成自动化的未来前景如何,您如何设想从劳动密集型流程向智能自动化的发展?
合成自动化的未来将以机器人技术、机器学习和人工智能的不断进步为标志,从而形成日益复杂和智能的自动化系统。
未来合成自动化的重点领域之一是开发可全天候运行、无需人工干预的自主实验室。这些系统将配备机器人和机器学习算法,能够执行常规任务、监控实验并根据生成的数据自主决策。
另一个重点领域将是把人工智能进一步融入药物发现过程。
这将涉及开发能够分析海量化学数据、预测化学反应结果和实时优化实验条件的人工智能算法。随着时间的推移,预计合成自动化将变得越来越智能,自动化系统将承担越来越复杂的任务,并产生新的见解,从而加速药物发现。这些高度自动化的系统将使研究人员能够以最少的人力和人工监督完成各种实验,从而实现更快、更高效的药物研发。
总的来说,合成自动化的发展轨迹是朝着更智能、更复杂的系统发展,这些系统可以处理复杂的实验,并快速生成大量数据,用于进一步优化药物发现过程。未来,我们有望看到从劳动密集型流程向高度自动化、智能化系统的发展,从而彻底改变药物发现过程,为各种疾病带来新的治疗方法。
。
考虑到这些论文的见解以及计算机辅助逆合成的进展,您认为人工智能和自动化的持续融合将如何塑造未来几年化学合成的格局?
人工智能和自动化的持续融合有望极大地塑造未来化学合成的格局。人工智能和自动化有望加快药物发现的速度,使化学家能够更快、更高效地合成化合物。这将使研究人员能够测试更多的分子,探索更广阔的化学空间。人工智能与自动化的结合还可能有助于减少化学合成对环境的影响,使研究人员能够找出更具可持续性的化学路线。
人工智能算法配合自动化合成,可以减少人为错误,使合成更加精确,从而获得更高质量的产品。它将加速药物发现过程中对化学空间的探索,从而发现原本通过传统方法难以发现的新化合物。将人工智能和自动化融入化学合成,有可能使该领域发生深刻的转化,大大加快药物发现的速度和效率,同时提高我们识别可持续和有效药物分子的能力。随着这些技术的不断融合,化学合成的前景一片光明。
信息披露:Cernak 实验室从默克公司的附属公司 MilliporeSigma(位于马萨诸塞州伯灵顿)、Relay Therapeutics、Janssen Therapeutics、SPT Labtech 和 MSD Inc.T.C. 持有 Scorpion Therapeutics 的股份,也是 Iambic Therapeutics 的联合创始人和股份持有人。