大数据与AI

IBM 将 AI 逆向合成分析带入云端

阅读时间: < 1 分钟

作者:

随着越来越多的 AI 继续在云中进行计算,IBM RXN for Chemistry 得到重大升级。

未来的计算是我们星球上最强大的变革力量之一。我们接触的一切都具有内置的计算功能,并且正在生成大量数据。这种影响不仅加快了我们日常生活的节奏,而且还加速了包括化学在内的更多传统工业领域的发展。

去年,在波士顿召开的美国化学学会 (ACS) 2018 年秋季会议上,IBM 研究院发布了 IBM RXN for Chemistry,这是一款基于云的应用,采用了将有机化学与语言相关联的设计理念。该应用背后的神奇之处在于,它是一种先进的神经机器转换方法,可以使用序列到序列 (seq2seq) 模型来预测最可能的化学反应结果。我们使用简单的 Ketcher 绘图界面设计了该工具,并在 IBM Cloud 中提供了该工具,用来预测正向化学反应的结果。

自发布以来,反响十分热烈,12 个月内即赢得了超过 6,500 名用户,进行了 5 万多次反应预测。目前,这项服务还被世界各地的多个实验室用于涉及到 AI 的自动化实验,在这些实验中,机器人根据 IBM RXN 和湿实验的反馈结果实时学习。人类和机器一起探索世界,这必将会爆发强大威力。

我们将自己的 AI 模型称为“分子转换器”。它经过端到端的训练,完全由数据所驱动,无需查询数据库或任何其他的外部化学信息。其中一个最受欢迎的功能是,用户可以创建项目,并与朋友或同事共享这些项目,还可以在复杂的多步反应合成或新颖的化学反应设计上展开协作。

在当时,这个 AI 模型的性能超过了其他所有数据驱动的模型,在正向化学反应预测上首次达到了超过 90% 的 top-1 准确率。

时至今日,它的正向模型性能仍然无人能及。

IBM RXN 再次崛起于云端

IBM 研究员 Philippe Schwaller 和 Riccardo Petraglia
(IBM 苏黎世研究院)正在研究逆向合成分析背后的过程。

类似于将化学问题从一种语言(反应物 + 试剂)转换为第二种语言(产品)的正向化学预测问题,研究团队立即注意到了反转转换过程的相似性。逆向问题不是预测可能的化学反应的结果,而是确定创建给定目标分子所需的化学物质。这个过程就是化学领域众所周知的逆向合成。目前,这项任务是由人类专家,尤其是合成有机化学家所掌控的。

在过去的 12 个月里,我们的团队致力于改进 IBM RXN 的用户体验。我们无缝扩展了逆向转换任务的方法,为 2019 年的重大事情做好了准备 – 拥有既定目标的逆向合成分析或化学反应序列。

逆向合成的实施比训练 AI 模型进行正向化学反应预测更具挑战性。过去几年里,尽管对逆向合成实施成果有过几次报道,但实际上,所有这些成果都只是通过领域专家认可的少数几种成功的化学合成方法来验证这种方法的性能而已。

我们的首要目标是从零开始构建一个评估指标,了解该模型的优势和局限性,并提供一种可以系统地改进 AI 技术的方法。

涉及到领域专业知识的团队合作

我们与意大利比萨大学的合成有机化学家团队合作,详细研究了逆向合成分析背后的人为过程。当面对设计新分子合成的挑战时,人类专家以一种公正的方式分析所有可能的化学键,这些化学键一旦断裂,便会生成通过反应产生目标起始化学物质的前体。然后我们重复进行分析,直到获得商用材料为止。

在确定哪种化学键最适合进行逆向合成分析时,人类专家会考虑以下因素来衡量所产生策略的优劣:步骤数(越少越好)、高产反应的使用、高选择性和启动前体的成本。在我们的研究中,合成有机化学家团队在每一个开发阶段均对预测质量进行了验证,对单个组件进行了校准,并对需要改进的 AI 策略提供了宝贵的反馈意见。

与意大利比萨大学的合成有机化学家合作
:Anna Iuliano 和 Valerio Zullo 教授

最后,比萨大学的研究团队对逆向合成预测进行了评分,使用的指标与他们在逆向合成课程中经常对学生使用的指标相同,目的是消除任何偏见,对当前技术状况进行客观分析。对于我们的 AI 模型而言,这是一项很难通过的考试,但 IBM RXN for Chemistry 却成功地解决了大多数设定的考试题。

在评估其性能时,很明显,模型中存在一定的缺陷和偏差,我们由此可以追踪到所用数据集的质量。

从专利中提取的数据集与其他几篇论文中使用的数据集相同,尽管只报告了成功的逆向合成,但也面临类似挑战。我们目前正在研究数据管理策略,力求提高数据集的整体质量,并为 IBM RXN 高分通过化学考试做准备。

现在就开始探索

通过使用统计数据,逆向合成架构在设计逆向合成时会像人类一样考虑所有相关问题。与正向预测模型相似,我们使用相同的 250 万个化学反应来训练正向和逆向化学反应预测模型。

正向/逆向预测模型的核心是 2018 年发布的分子转换器。它使用类似贝叶斯概率的方式对可能的断开模式进行全面探索,进而在诸多可能的断开模式中找到最有效的模式。我们还引入了新的统计指标来评估整个模型及其各个组件的性能。

立即试用 IBM RXN for Chemistry,为您的合成有机化学课做好准备,或者为解决日常研究工作中遇到的化学问题找到灵感。请将它视为您的化学伴侣。


结合使用语言模型和超图探索策略来预测逆向合成途径Philippe Schwaller、Riccardo Petraglia、Riccardo Pisoni、Costas Bekas 和 Teodoro Laino(IBM 苏黎世研究院);Valerio Zullo 和 Anna Iuliano(比萨大学)

More 大数据与AI stories

波士顿动力公司与 IBM 联手,运用 IBM 解決方案将移动边缘分析引入工业运营

云计算

阅读时间: < 1 分钟 在制造和仓库等领域的运营中,为了帮助企业利用数据和分析,以便实时发现问题、改进决策、更高效地执行任务,对 AI 驱动的机器人的需求不断增长。但要获得真正的收益,必须在运营中让 AI 尽可能靠近数据来源。 ...read more


IBM 携手亮亮视野 “AI + AR”,带您体验 “无边界的虚拟企业”

云计算, 智能制造, 运营管理

阅读时间: < 1 分钟 近年來,随着设备传感物联技术成熟和AI应用的普及,新一代的技术正在重塑传统的资产密集行业。北京亮亮视野科技有限公司成立于2014年,深度整合新一代AI、IOT、大数据、5G的技术,为企业提供高效AR交互体验。“亮亮视野希望通过增强现实与人工智能技术,以第一视角交互让人与人、人与机器、人与数据的沟通变得更自然高效。” 北京亮亮视野科技有限公司企业事业部总经理娄身强说。 ...read more


管好资产,让数据发电-布鲁斯电力运用 IBM Maximo 释放电网潜能

云计算, 运营管理

阅读时间: < 1 分钟 加拿大布鲁斯电力公司总部位于安大略省的蒂弗顿,是世界上最大的核能发电机和医用同位素的领先生产商。首席资讯官Todd Warnell 先生分享了布鲁斯电力如何释放数据价值优化电网潜能。 ...read more