首页 > 资讯

在人与机器之间共享化学知识

来源:互联网 发表时间:2023-08-24 16:00:49
分享到


(资料图片)

导读 结构式显示了化合物是如何构造的,即它们由哪些原子组成,它们如何在空间上排列以及它们如何连接。化学家可以从结构式中推断出哪些分子可以...

结构式显示了化合物是如何构造的,即它们由哪些原子组成,它们如何在空间上排列以及它们如何连接。化学家可以从结构式中推断出哪些分子可以相互反应,哪些分子不能相互反应,如何合成复杂的化合物,或者哪些天然物质由于与细胞中的目标分子结合而可以具有治疗效果。

发展于 19 世纪的分子结构式表示法经受住了时间的考验,至今仍在每本化学教科书中使用。但让人类直观地理解化学世界的只是软件的黑白像素的集合。“为了使结构式中的信息可在可自动搜索的数据库中使用,必须将它们翻译成机器可读的代码,”耶拿大学分析化学、化学信息学和化学计量学教授 Christoph Steinbeck 解释道。

图像变成代码

而这正是使用人工智能工具“DECIMER”可以做到的,该工具是由来自威斯特伐利亚应用科学大学的 Steinbeck 教授和他的同事 Achim Zielesny 教授领导的团队开发的。DECIMER 代表“化学图像识别深度学习”。它是一个开源平台,互联网上的每个人都可以免费使用,并且可以在标准网络浏览器中使用。只需拖放即可将包含化​​学结构式的科学文章上传到那里,人工智能工具将立即开始工作。

“首先,在整个文档中搜索图像,”Steinbeck 解释道。然后,该算法识别所包含的图像信息,并根据它是化学结构式还是其他图像对其进行分类。最后,将识别的结构式翻译成化学结构代码或显示在结构编辑器中,以便可以进一步处理。“这一步是该项目的核心,也是真正的成就,”斯坦贝克补充道。

这样,咖啡因分子的化学结构式就变成了机器可读的结构代码CN1C=NC2=C1C(=O)N(C(=O)N2C)C。然后可以将其直接上传到数据库中并链接到有关该分子的更多信息。

为了开发 DECIMER,研究人员使用了最近才建立的现代人工智能方法,这些方法也被用于目前广泛讨论的大型语言模型(例如 ChatGPT)中。为了训练其人工智能工具,该团队从现有的机器可读数据库中生成了结构公式,并将其用作训练数据——迄今为止,已有约 4.5 亿个结构公式。除了研究人员之外,公司也已经在使用人工智能工具,例如将专利说明书中的结构公式转移到数据库中。

几年前,Steinbeck 和 Zielesny 提出了开发一种用于解码化学图像的人工智能工具的想法。两位化学家对与具有千年历史的亚洲棋盘游戏围棋相关的人工智能方法的开发感兴趣。2016年,他们与全球数百万人一起观看了当时最好的围棋棋手韩国李世石与计算机软件“AlphaGo”之间的精彩对决,机器以4:1获胜。

“这是晴天霹雳,向我们展示了人工智能的强大力量,”斯坦贝克回忆道。在那之前,人们认为算法在这款游戏中能够与人类的创造力和直觉相媲美几乎是不可想象的。“不久之后,一个人工智能工具发展出了准超人的棋力,它不是通过无数次人类对弈的艰苦训练——就像 AlphaGo 的情况一样——而是简单地通过系统一次又一次与自己对弈的过程,并优化其游戏风格,我们意识到这些新方法还可以通过足够的训练数据解决其他非常复杂的问题。我们想将其用于我们的研究领域。”

版权声明:本文由用户上传,如有侵权请联系删除!

关键词:

保安全、拿资格、抠细节 冬运中心全面进入北京冬奥会临战状态

2021-12-16

人民财评:稳步朝着实现共同富裕的目标迈进

2021-12-16

靠双手让日子变得更美好

2021-12-16

第一观察·瞬间 | 中俄元首视频会晤:相约北京见,携手向未来

2021-12-16

世卫组织:全球累计新冠确诊病例达270791973例

2021-12-16

他们为何奔向先行示范区——2021深圳全球招商大会透视

2021-12-16

Copyright   2015-2022 华东木材网 版权所有  备案号:京ICP备2022016840号-41   联系邮箱:2 913 236 @qq.com