白皮书:

利用工业废料合成可持续的药物和农用化学品的计算机辅助设计

改编自
P.Le Pogam, N. Papon, M. A. Beniddir, V. Courdavault, ChemSusChem2022, 15, e202201125. https://doi.org/10.1002/cssc.202201125


化学家们正在寻求更有效地利用工业合成路线中剩余的化学资源,从而提高可持续性并克服前体分子的供应链瓶颈在这里,一种最先进的基于计算合成的方法可以识别出具有商业价值的可合成分子,这些分子可以使用大规模工业生产过程中产生的一种或多种常见废品作为底物或前体。

引言

近几十年来,化学家们一直在寻求通过重新利用一种或多种废品来提高大规模工业合成过程的可持续性。与分析化学中基于计算机的合成策略类似,最近的计算机算法正在编制工业废料清单,这些废料可在制药相关产品的新型合成路线中用作底物或前体。这一过程被称为循环化学概念 可持续化学

硅转化模块的可持续性特征排名

即使是一小组底物,也能生成数百万种可行化合物的合成路线。因此,基于计算机的程序需要对合成策略的简易性和可持续性进行排序。硅学 转化模块从内部收集的 10,000 多个反应中学习,这些反应包括不相容的结构主题、可接受的底物、建议条件、试剂和典型条件等信息。用于开发合成路线的其他信息包括建议使用的溶剂、通常的温度范围、反应串联进行的能力、可再生资源、试剂商业化废品的丰富程度、工业化学废物的地理来源,以及根据健康或环境标准避免使用有问题的溶剂。图 1提供了人工智能 (AI) 程序和相关元数据的概述,这些程序和元数据是在开发可合成产品的过程中考虑的,这些产品可以重复利用工业废料作为合成砌块或底物,并提高化学的可持续性。

在 ICHO 和 SW 程序中,从启发式专家化学规则中学习(ICHO+、SW+)只能略微提高合成计划的效率。将 SW 程序限制为产品匹配反应(SW2、SW2+)则提高了它们的性能。不过,ICHO+ 仍然是排名最高的途径,这可能是由于它对底物有更多的了解。

在开发涉及实验确定反应和相对先进合成路线的合成路线时,对三类程序的性能进行了评估。图 2 比较了 ICHO+、SW2+ 和 SMALLER 程序开发的四种复杂产品的合成计划。ICHO+ 在以下四种产品的合成计划中排名最高:BRD 7/9 抑制剂、5-羟色胺-去甲肾上腺素再摄取抑制剂 (+)-synosutine 、天然产品 seimatopolide A 和前列腺素类似物比马前列素。

例如,基于 AllChemy 的平台还包含一种人工智能算法,可以预测合成化合物的分子特性。再比如,SYNTHIATM 逆合成软件可以高效探索最具成本效益和创新性的合成路线,以生产目标分子。化学家可以利用筛选选项和艺术可视化来优化目标化合物的合成路线。SYNTHIATM 允许自定义搜索参数,以防止或促进特定反应、试剂或分子类别,包括所需的立体异构体。它可以生成一份市售起始原料清单,同时通过 ISO/IEC 27001 信息安全认证,保证客户数据的完整性和保密性。

人工智能程序的力量

Le Pogam 及其同事介绍了 Wolos人的文章[1],该文章使用基于 Allchemy 的程序从 189 种化学废料中找出可合成的医药相关产品或农用化学品。该算法的每一代合成都会将合成的产品与初始物质和中间代获得的物质进行比较(图 1B)。由于目标是促进在高效时间内从特定废物中合成高价值化合物,研究人员可以通过保留用作合成砌块的小化合物以及与目标合成化合物结构相似的分子,提高下一代分析/合成的效率。

人工智能创建的网络通常能提供高组合度的多样化反应剧目,从而合成目标产品或药物(图 1C)。操作员应将阈值设定为少于 100,000 个化合物,以保持合理的计算时限。人工智能创建的网络每次生成后都会查询各种流程变量,这些变量直接影响合成流程的安全性、效率、成本和可持续性。

元分数汇编了合成路线的属性,其排名也反映了对至少五个类别中不受欢迎属性的惩罚,这些类别的分数从 1(最理想)到 10(最不理想或最有害)不等(图 1D)。对使用有害或有问题的试剂或溶剂进行惩罚,因为最好使用健康和环保的试剂、底物、溶剂和合成砌块。对具有挑战性的反应条件,如极端温度或实验困难,如剧烈的外热式或内热式反应,也要进行处罚。产生更多副产品和废物也会受到惩罚,这就是所谓的低原子经济性,通常用过程质量强度(PMI)来衡量。优选反应产生的废物或副产品最少。PMI 编制了合成过程中所有材料(试剂、催化剂、反应物、溶剂和工作化学品)相对于分离产品产率的质量。最后,用于合成砌块或基质的工业废品最好来自本地,以减少运输成本和供应链中断。因此,如果工业废料和潜在用户的地理位置不同,则会受到惩罚。

用 189 种废弃产品和七轮化学转化进行人工智能分析,提供了 3 亿种化合物的硅合成路线,其中包括 69 种药物和 98 种农用化学品。Wolos等人 [1]为多个目标物确定了新的合成路线,这些路线在大多数良性条件下使用同源废品,步骤相对较少。有趣的是,所述计划可以通过在 189 种可用废物中添加 1000 种基本试剂,将其合成路线的开发范围扩大到几种最常用的处方药。Wolos等人[1]已经通过实验验证了其中几种计算机预测的途径[1]。

总结

所描述的人工智能合成工具为从一组任何广泛可用的前体(包括工业废品)中预测多种化合物的合成路线提供了机会。当前的工作流程结合了有机化学反应及其相关元数据的广博知识,可在每次化学转化时评估其是否符合可持续发展和绿色化学指标。这些额外的检查有助于确保目标化合物的拟议合成路线具有较高的工业实际产量,并提供可持续的前体获取途径。这一完善的人工智能工作流程扩展了逆合成化学家基于底物转化的先验 网络,以替代可能结合本地工业废品的新型合成路线。

参考文献

[1] Wołos, A.等人 (2022 年)。计算机设计的化学废料药物再利用。自然》。DOI: 10.1038/s41586-022-04503-9.