另一个突破!人工智能大模型预测蛋白质结构速度再次提高数百倍!

2024-01-14 17:16:42   编辑:帝国联盟
导读在生物细胞中有三种大分子:DNA、RNA和蛋白质。DNA和RNA记录了生物的遗传信息,但蛋白质确实在细胞中发挥了作用。人体内大约有10万种蛋白质...
在生物细胞中有三种大分子:DNA、RNA和蛋白质。DNA和RNA记录了生物的遗传信息,但蛋白质确实在细胞中发挥了作用。人体内大约有10万种蛋白质,每种蛋白质都有自己的特定功能,但它们是由20种氨基酸按不同比例组合而成,各种氨基酸在蛋白质中折叠成特定的三维结构。正是这种三维结构决定了每种蛋白质的功能。
 
因此,蛋白质的三维结构分析对蛋白质的功能、人体生理现象、内在机制、疾病归因和药物研发起着关键作用。这就是为什么科学家们想尽一切办法找出几十年来各种蛋白质的三维结构。
乍一看,大多数蛋白质就像一个杂乱无章的原子,但如果你仔细看,你会发现它们实际上是根据一定层次组织的复杂结构。在底层,一些氨基酸通过肽键组合在一起,形成一些多肽链。多肽链中的氨基酸序列称为蛋白质的一级结构。然后,不同的多肽链通过氢键连接,折叠成螺旋或环状等简单的形状,称为蛋白质的二级结构。
 
接下来,在更大的层面上,螺旋或环进一步折叠成三维空间中紧凑的结构,称为蛋白质的三级结构。所有蛋白质都有三级结构,三级结构与蛋白质的稳定性关系最大。如果三级结构被破坏,蛋白质将失去一部分或所有功能。有些蛋白质有四种结构,
 
传统实验室主要有三种观察蛋白质结构的方法,即核磁共振、X射线晶体学和冷冻电镜。然而,这些方法往往依赖昂贵的设备,需要几年的时间才能找出每种蛋白质的三维结构。人体内大约有10万种蛋白质,很少有科学家分析过三维结构。为了研究大量未知的蛋白质,有必要发明一种全新的方法。例如,在找出蛋白质的一级结构后,人工智能被用来预测它的二级、三级和四级结构。
 
2018年,人工智能正式参与蛋白质三维结构的预测,在其中展示了自己的才华。它的速度非常快。它可以预测具有高置信度的蛋白质结构,需要几天甚至几分钟才能获得,极大地促进了生物化学、细胞生物学、遗传发育、神经生物学、微生物学、病理药理学等领域的发展。
 
2023年10月9日,国际顶级学术期刊《自然》子刊《机器智能》发表了百度飞桨螺旋桨与百图生科研发的文心生物计算大模型的结果,提出了世界上第一个开源、提供在线服务、无需MSA输入的大型蛋白质结构预测模型HelixFold-Single。这是百度在生物计算领域的又一突破,打破了依赖MSA检索的AlphaFold2等主流模型的速度瓶颈,创新了新的人工智能训练方案,平均提高了数百倍的蛋白质结构预测速度,实现了秒级预测。门蛋白7et2_H以AlphaFold2为例,预测其结构需要1280秒(超过21分钟),而HelixFold-Single只需11秒,速度提高了115倍。
 
人工智能大模型技术正在推动生物计算领域的快速发展,可以帮助生命科学领域的研究人员更加方便高效地工作,开展更多的开拓性研究,如探索治疗特定癌症和病毒感染疾病的方法,开发新的抗生素和靶向药物,或开发更高效的工业酶,为人类健康和工业发展做出持续的贡献。
免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章