AI研习丨化合物逆合成路线设计方法综述
摘 要:对目前计算机辅助逆合成分析的方法进行分类总结,介绍了单步逆合成预测方法和多步逆合成路径规划策略,并对它们的优缺点进行分析。最后讨论了现有方法的不足之处,以及自动化逆合成分析面临的潜在挑战和机遇。
关键词:逆合成;路径规划;深度学习;图神经网络;编码器-解码器虽然多步逆合成路径规划是一个复杂的过程,任何单步逆合成预测的失败都可能破坏整个合成过程,但是 Barbara 等证明了计算机自动综合规划逆合成路线是可能的。虽然单步逆合成预测方法已经有很大改进,但为了完善整个逆合成路线设计,满足目标分子高复杂性的实际要求,还需要提高多步逆合成路线规划的性能。多步逆合成包括单步逆合成预测模块和通过递归应用单步逆合成预测模块,来搜索最优逆合成路径的规划策略。下面重点介绍逆合成路径的规划策略。逆合成路径规划策略大致可以分为基于蒙特卡罗树搜索(MCTS)的方法、基于专家打分函数的方法、基于与或树的方法、基于深度学习的方法、基于强化学习的方法和基于超图的方法。MCTS是一种通过逐步改进统计树的决策过程,寻找最优决策并引导逆合成路线走向特定搜索方向的方法。搜索树的自动增长需要多次迭代,迭代次数越多,MCTS 就越接近完美的解决方案。此外,多步逆合成中每步可供选择的路径组合空间是天文数字,但MCTS的策略能够有效地减少搜索空间,找到当前树中最重要的节点Marwin等使用MCTS和符号人工智能来设计逆合成路线。通过将MCTS与指导搜索的扩展策略网络,以及预先选择逆合成步骤的过滤网络相结合设计多步逆合成路线,比基于启发式的传统计算机辅助搜索方法快30倍。Lin等使用带有启发式评分函数的MCTS,构建了一个完全数据驱动的端到端逆合成路线规划系统来规划逆合成路径。基于专家打分函数的方法是基于化学直觉的启发式算法,例如,由化学家制定的一系列规则给原子键断开、环的断开与形成打分。而机器学习方法又是完全数据驱动的方法, 缺乏专家领域知识。Tomasz等证明,基于专家打分函数的方法和机器学习方法可以协同配合,当神经网络根据高质量、专家编码的反应规则匹配的文献数据进行训练时,可以获得更高的预测精度。与或树主要适用于结果导向的各种问题,它通过将一个问题进行不断的分解,寻找出不同的解决方案,最后通过判断来找出最适合的解决方案。因此,与或树可以很自然地应用到多步逆合成的搜索策略中。通过将目标分子不断地进行分解,根据分解的方式不同,可以得到不同的前体分子和逆合成路径,最后通过判断来找出最合适的逆合成路线。Zheng等通过将与或树应用到生物合成的路径搜索中,可以有效地对可能的生物合成路径进行采样。随着深度学习在各领域的蓬勃发展,科学家们也尝试使用深度学习的方法来解决逆合成路径规划问题。Mo等引入了一种数据驱动的方法,利用动态树结构长短期记忆 (tree-LSTM)模型来评估逆合成路径。经过训练的tree-LSTM模型学会将路径级别的信息编码为一个具有代表性的隐向量,促进相似路径的聚类,以帮助解释计算机程序生成多样化的合成路径。Chen等提出了一种基于神经网络的类似A*算法 的逆合成路径搜索算法Retro*,能够有效地寻找高质量的逆合成路径。它将搜索过程维护为一棵与或树,并使用非策略数据学习搜索偏差;然后在神经网络的指导下,在新的规划过程中高效地执行最佳优先搜索。Kim等直接训练深度神经网络生成理想的逆合成反应路径。训练过程是一个自我提升的过程,模型通过不断模仿自己已经成功发现的逆合成路径来提高自己的性能。此外,他们还提出了一种基于正向反应模型的增强方案,实验结果表明该方案显著提高了逆合成问题的求解成功率。Coley等结合人工智能驱动的合成路径规划和机器人控制的实验平台,设计了一个逆合成路线规划系统。合成路线通过归纳数百万个已发表,并在计算机中经过验证的化学反应,提高规划的成功率。强化学习又称为评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略,以达成回报最大化或实现特定目标的问题。如果将逆合成规划问题描述为一个单人游戏,在游戏中化学家 ( 或计算机程序 ) 的获胜目标是通过一系列关于进行哪种反应的选择,从目标分子推断出反应物,那么逆合成路径规划问题就可以使用强化学习的方法进行解决。John等使用强化学习,根据用户定义的成本度量在每个单步逆合成预测步骤中做出 ( 接近 ) 最优反应的选择。Wang等将MCTS与通过强化学习训练的价值网络结合,提高了在固定搜索时间内找到有效合成路径的成功率。在传统的图结构中,每条边只能连接两个结点,而超图中的超边可以同时连接大于或等于2个结点。逆合成路径规划树相当于一个有向无环超图,一个起始节点代表一个目标分子,连接到不同节点的超边代表涉及这些对应分子的所有可能反应。因此逆合成路径的规划过程,可以看作超图的动态扩展过程。Philippe等根据类似贝叶斯概率进行超图的动态过滤和扩展,在没有人为干预的情况下自动进行逆合成路径规划。在这些多步逆合成路径规划策略中, 基于MCTS和基于深度学习的方法是目前最流行的方法。但由于缺乏统一的评价标准,不同的路径规划策略都有其各自的优势和不足。基于深度学习的方法可能是比较有前景的方法,但它是一种数据驱动的基于统计的方法。如果能够将基于数据的统计人工智能与基于知识的符号人工智能结合用于多步逆合成路径规划,可能是一种更有前景的方法。随着大型化学反应数据库的建立,计算机算力的提高,计算机辅助逆合成分析已经取得了惊人的进步;同时,这些进步也使得研究人员相信实现完全自动化地进行逆合成预测是可行的。但是,目前的研究成果距离逆合成预测的完全自动化还有一段距离。机器学习方法的性能在很大程度上取决于化学反应数据库的质量,高质量的数据库将加速逆合成的进一步发展。因此,建立统一的高质量化学反应数据库十分必要。纯数据驱动的机器学习模型有时缺乏可解释性,并且容易受到训练数据的分布影响出现预测偏差。一般来说,机器学习模型更可能从数据集中出现频率高的键断开规则中学习,忽略其他罕见但可能更简单的键断开方式。将数据驱动方法与基于知识的人工智能方法相结合不仅可以提高模型的可解释性,而且可能是减少模型构建偏差,以及为逆合成问题提供新颖有效的解决方案。现阶段大多数逆合成路径规划算法设计时没有考虑反应条件(如试剂、催化剂、溶剂和温度等),未来可以在逆合成综合规划中添加反应条件来约束逆合成规划的路线。当前的单步逆合成预测评估指标通常是比较top-k的预测准确率,这种评价方式不能全面地评价模型的好坏。而多步逆合成路径规划算法缺乏比较基准,无论是单步还是多步逆合成都尚未形成成熟的评价方法。因此,建立科学和全面的评估标准需要科学家们的共同努力。提高人工合成化合物的能力可以带来巨大的社会和技术影响。利用人工智能技术,在研究人员的不懈努力下,逆合成分析问题的完全自动化指日可待。
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。