视频号
视频号
抖音号
抖音号
哔哩哔哩号
哔哩哔哩号
app
前沿资讯手机看

我要投稿

投稿请发送邮件至:weidy@instrument.com.cn

邮件标题请备注:投稿

联系电话:010-51654077-8129

二维码

我要投稿

投稿请发送邮件至:weidy@instrument.com.cn

邮件标题请备注:投稿

联系电话:010-51654077-8129

AlphaFold的新对手?新AI预测微生物六亿多蛋白结构

分享到微信朋友圈

打开微信,点击底部的“发现”,

使用“扫一扫”即可将网页分享到朋友圈。

分享: 2022/11/03 11:55:02
导读: 元宇宙平台公司Meta的研究人员使用人工智能 (AI) 来预测来自细菌、病毒和其他尚未表征的微生物的约 6 亿种蛋白质的结构。相关研究已经提交生物预印本网站biorxiv.org。

Meta(前身为 Facebook,总部位于加利福尼亚州门洛帕克)的研究人员使用人工智能 (AI) 来预测来自细菌、病毒和其他尚未表征的微生物的约 6 亿种蛋白质的结构。负责人Alexander Rives说:“这些是我们最不了解的神秘蛋白质结构。我认为它们为深入了解生物学提供了潜力。”

该团队使用“大型语言模型”生成了预测工具——人工智能AI,这是可以从几个字母或单词预测文本的工具的基础。

通常,语言模型是在大量文本上进行训练的。为了将它们应用于蛋白质,Rives 和他的同事将它们输入已知蛋白质的序列,这些蛋白质可以由 20 种不同氨基酸组成的链表达,每一种都用一个字母表示。然后,该网络学会了“自动完成”蛋白质,其中一部分氨基酸被遮蔽。

蛋白质“自动完成”

Rives 说,“这种培训使网络对蛋白质序列有了直观的了解,这些蛋白质序列保存了有关其形状的信息。第二步,受到 DeepMind 开创性的蛋白质结构 AI AlphaFold 的启发,将这些见解与有关已知蛋白质结构和序列之间关系的信息结合起来,从蛋白质序列中生成预测结构。Meta 的网络,称为 ESMFold,不如 AlphaFold 准确,但它在预测结构方面快了大约 60 倍,这意味着我们可以将结构预测扩展到更大的数据库。”

做一个测试案例,研究人员决定将他们的模型应用于来自环境(包括土壤、海水、人类肠道、皮肤和其他微生物栖息地)的批量测序“宏基因组”DNA 数据库。其中绝大多数编码潜在蛋白质的 DNA 条目来自从未被培养过且科学未知的生物体。

Meta 团队总共预测了超过 6.17 亿种蛋白质的结构。这项工作只用了 2 周时间(AlphaFold 可能需要几分钟才能生成一个预测)。Rives 说:“任何人都可以免费使用这些预测,就像模型底层的代码一样。”

AlphaFold 和 AI 蛋白质折叠革命的下一步是什么

在这 6.17 亿个预测中,该模型认为超过三分之一是高质量的,因此研究人员可以确信整体蛋白质形状是正确的,并且在某些情况下可以辨别更精细的原子级细节。数以百万计的结构是全新的,与通过实验确定的蛋白质结构数据库或已知生物体预测的 AlphaFold 数据库中的内容不同。

首尔国立大学的计算生物学家 Martin Steinegger 说:“AlphaFold 数据库的很大一部分是由彼此几乎相同的结构组成的,而“宏基因组”数据库应该涵盖了以前看不见的蛋白质宇宙的很大一部分,即现在有一个很大的机会来解开更多的谜底。”

Sergey Ovchinnikov教授对 ESMFold 做出的数以亿计的预测感到疑惑:有些可能缺乏明确的结构,至少是孤立的,而另一些可能是非编码 DNA,被误认为是蛋白质编码材料。似乎我们对仍有一半以上的蛋白质空间一无所知。

更精简、更简单、更便宜

德国慕尼黑工业大学的计算生物学家 Burkhard Rost 对 Meta 模型的速度和准确性印象深刻。但他质疑在预测宏基因组数据库中的蛋白质时,它是否真的比 AlphaFold 的精确度更具优势。

基于语言模型的预测方法,他的团队开发了一种更适合快速确定突变如何改变蛋白质结构的方法,显然AlphaFold 无法做到这一点。

据称,DeepMind 目前没有将宏基因组结构预测纳入其数据库的计划,但并未排除未来发布的可能性。Steinegger 和他的合作者已经使用了一个 AlphaFold 版本来预测大约 3000 万个宏基因组蛋白的结构。他们希望通过寻找新形式的基因组复制酶来发现新型 RNA 病毒。他认为我们很快就会对这些宏基因组结构的分析产生爆炸式的兴趣。

参考资料:

https://doi.org/10.1038/d41586-022-03539-1


[来源:转化医学网]

用户头像

作者:Ev

总阅读量 55w+ 查看ta的文章

网友评论  0
为您推荐 精选资讯 最新资讯 新闻专题 更多推荐

版权与免责声明:

① 凡本网注明"来源:仪器信息网"的所有作品,版权均属于仪器信息网,未经本网授权不得转载、摘编或利用其它方式使用。已获本网授权的作品,应在授权范围内使用,并注明"来源:仪器信息网"。违者本网将追究相关法律责任。

② 本网凡注明"来源:xxx(非本网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,且不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。

③ 如涉及作品内容、版权等问题,请在作品发表之日起两周内与本网联系,否则视为默认仪器信息网有权转载。

使用积分打赏TA的文章

到积分加油站,赚取更多积分

谢谢您的赞赏,您的鼓励是我前进的动力~

打赏失败了~

评论成功+4积分

评论成功,积分获取达到限制

收藏成功
取消收藏成功
点赞成功
取消点赞成功

投票成功~

投票失败了~