人工智能已经在带领一场全新的科学革命

2022-06-20 19:15:26   编辑:葛剑
导读近日,谷歌一名研究员因声称一个人工智能有“个性”而被公司强制带薪休假,人工智能再度大热。

近日,谷歌一名研究员因声称一个人工智能有“个性”而被公司强制带薪休假,人工智能再度大热。事实上,媒体的笔触和大众的目光似乎总是聚焦在更容易理解的东西上,比如聊天、画图。然而,人工智能在科学领域取得的进步,虽然不那么耸人听闻,却对人类的进步产生了实实在在的影响,甚至可以说,它正在引领一场新的科学革命。本文是对人工智能在科学领域中的作用的总结。文章来自编译。

自从20世纪50年代发现DNA以来,生物学家一直试图将遗传密码的长度与细胞组成的一系列过程联系起来——例如,包括特定抗体的mRNA转录,这是现在著名的mRNA疫苗的关键。虽然自发现DNA以来,人类在测序和理解基因组方面取得了进展,但仍然缺少一个重要的环节。生物学家现在缺乏的是一种仅使用DNA或RNA源代码准确有效地预测未知蛋白质三维形状的方法。在生物学中,结构决定功能。蛋白质在细胞中的作用取决于它的形状。空心圆柱体是一种很好的膜受体,U型酶可以在其峡湾状的空腔内催化化学反应。要了解人类的疾病,预测甚至设计蛋白质将是一个飞跃,它将为一系列疾病开辟新的治疗方法。

然而,70多年来,科学家们一直坚持慢方法。这些方法会导致计算机功率不足,很大程度上还得靠自己的猜测来整理蛋白质结构。虽然生物学家已经知道组成每种蛋白质的各种氨基酸的DNA编码片段是什么,但他们仍然缺乏一个可重复和可概括的公式来解决这种所谓的“蛋白质折叠问题”。他们需要系统地了解这一点:任何一串氨基酸一旦连接起来,将如何折叠成三维形状?通过回答这个问题,我们可以解开浩瀚的蛋白质世界之谜。

2020年,谷歌的人工智能团队DeepMind宣布,其AlphaFold算法已经解决了蛋白质折叠问题。起初,这一惊人的突破让大多数人兴奋不已,科学家们已经做好了随时测试新工具的准备,并且很享受其中的一些。毕竟这不就是几年前开发AlphaGo并打败围棋世界冠军的公司吗?但是,围棋比象棋要复杂得多,但即使这么难,相对于蛋白质的折叠问题,掌握围棋的难度也是微不足道的。但AlphaFold通过横扫对手证明了自己的科学精神。每年,生物学家团队都会参加一场比赛,仅根据蛋白质的遗传密码来猜测蛋白质的结构。AlphaFold算法也报名参赛,性能远超人类竞争对手。它预测的最终形状误差只有一埃(一个原子的宽度)。不久后,AlphaFold正确预测了新型冠状病毒“刺突”蛋白的形状(这种病毒的膜受体是疫苗靶向攻击的目标),从而通过了现实世界中的首次测试。

AlphaFold的成功很快变得无法忽视,科学家们开始在实验室中尝试这种算法。2021年,《科学》杂志将AlphaFold的开源版本评为“年度方法”。生物化学家、《科学》杂志主编h·霍尔登·索普(H. Holden Thorp)在一篇社论中写道:“就科学成就和未来研究的赋能而言,蛋白质折叠的突破是历史上最伟大的突破之一。”如今,AlphaFold的预测已经非常准确,准确到经过70多年的探索,蛋白质折叠问题被认为已经解决。尽管蛋白质折叠问题可能是迄今为止人工智能在科学领域取得的最显著的成就,但人工智能正在许多科学领域悄然取得新的发现。

通过加速发现过程和为科学家提供新的调查工具,人工智能也在改变科学研究的方式。这项技术升级了显微镜和基因组测序仪等研究支柱,为仪器增加了新的技术能力,并使它们更加强大。人工智能药物设计和重力波探测器为科学家提供了探索和控制自然的新工具。在实验室之外,人工智能还可以部署先进的模拟能力和推理系统,开发真实世界的模型,并应用这些模型来测试和验证假设。由于人工智能对各种科学方法产生了广泛的影响,人工智能正在引发一场科学革命,突破性的发现、新技术、增强的工具和自动化的方法加快了科学进程和准确性。

除了蛋白质折叠问题,人工智能还通过在许多领域的发现证明了它的科学价值,如宇宙学、化学、半导体设计和材料科学。例如,DeepMind的团队开发了一种计算分子电子密度的算法,这种算法已经超过了科学家使用了60年的快速方法。知道特定分子的电子密度,有助于了解材料的物理化学性质。但由于电子受到量子力学的约束,计算比电子密度的方程非常复杂,很快就会成为计算的噩梦。因此,科学家们转向以材料中电子的平均密度为指导,冷静地回避困难的量子计算。但是DeepMind的算法是直接解决量子问题的,而且已经被证明比那个捷径更准确。与解决蛋白质折叠问题类似,人工智能优于科学家几十年来使用的方法,它还解锁了精确预测物理和化学性质的新方法。

人工智能对科学的影响不仅限于新发现,在这四个关键方面也有很大的影响。首先,人工智能可以快速阅读科学文献,从而学习科学的基本规则、事实和方程,帮助科学家管理淹没各个领域的大量论文和数据。例如,仅在2020年,将出版10万至18万份关于新冠肺炎的科学期刊。虽然研究人员专注于全球疫情等紧急事项是合理的,但新冠肺炎的相关论文仅占最大生物医学数据库中总论文数的4%-6%左右。产生的论文和数据太多,已经远远超过了任何一个科学家的阅读能力,使得研究人员无法跟上所在领域的创新步伐。

这就是人工智能的用武之地。例如,在药物化学领域,Insilico公司推出了一种完全由人工智能设计的药物,用于治疗一种叫做特发性肺纤维化(IPF)的疾病。现在这种药物已经进入一期临床试验阶段。Insilico的人工智能是如何设计药物的?他们的算法会阅读医学文献,然后选择疾病目标,找出可以准确定位的潜在蛋白质、细胞或病原体。一旦选择了目标,算法就可以设计治疗方法来治疗疾病。Insilico开发了一个端到端的药物发现人工智能平台,可以自动获取该领域的最新成果和数据,让科学家能够及时了解情况,而不会被海量数据淹没。

其次,随着仪器越来越精确,对自然的探索越来越深入,科学家们不得不面对海量的数据。在这方面,人工智能也能有所帮助。阿贡国家实验室的一组科学家开发了一种算法,可以理解时空连续体结构中的引力波。爱因斯坦预言了这种波纹的存在,但直到2015年才被发现。仅用七分钟,算法就处理了一个月的数据,实现了引力波的加速、可扩展、可重复探测。

更好的是,这种算法可以在标准的图形处理单元(GPU)上运行,这样研究人员就不需要特殊的设备来收集引力波数据并对其进行解释。亚贡的数据科学和学习(DSL)部门主任伊恩·福斯特(Ian Foster)说:“这个项目让我兴奋的是,它展示了如何通过适当的工具将人工智能方法自然地融入科学家的工作流程中——以便他们能够更快更好地完成工作——以增强而不是取代人类的智能。“有了人工智能,过去的数据灾难现在变成了可管理的信息流,可以加快科学的步伐。

第三,人工智能一直在悄悄地升级那些已经成为任何实验室支柱的仪器:显微镜和DNA测序仪。在argon国家实验室,研究人员找到了一种方法,可以提高电子显微镜检索相关样本信息的能力,同时提高仪器的分辨率和灵敏度。电子显微镜与很多人在高中或大学生物课上看到的不同,因为它不依赖可见光来构建图像。相反,顾名思义,它们使用的是电子,所以电子显微镜拍摄的图像比其他显微镜的分辨率更高,图像更精细。氩国家实验室的研究人员还设计了一种在电子显微镜上用人工智能记录相位数据的方法,这种方法可以传输关于样品物理和化学特征的关键信息,从而提高仪器的能力。

有点类似,人工智能带来的另一个升级是所谓的光场显微镜的升级。这台仪器可以拍摄高清晰的三维动态图像。过去,科学家重建图像需要几天时间,但有了人工智能,处理这种高分辨率动态数据所需的时间缩短到了几秒钟,分辨率或细节不会丢失。DNA测序仪作为基因组时代的主力军,也得益于人工智能的帮助。今年早些时候,一组科学家通过使用人工智能将DNA测序所需的时间减少了一半,预计很快将再次减半。简而言之,人工智能正在升级甚至最基本的科学工具。

最后,人工智能在实验室中真正大放异彩的地方是复杂系统的模拟。在人工智能的帮助下,模拟复杂系统已经成为基础科学研究中越来越常见的工具。去年,研究人员通过在物理、天文、地质和气候科学等十个科学领域建立突破性的模拟,展示了人工智能的多学科能力。所有10个模拟器都由同一个名为DENSE的深度神经网络训练。与其他方法相比,仿真速度提高了10亿倍之多,精度可以保持不变。最关键的是,模拟器可以用来解决“逆问题”,即研究人员已经知道结果,但想找出哪些变量会造成这样的输出。人工智能擅长这种计算,它可以很容易地找出如何得到一个具体的答案。

模拟是有用的,但研究人员也想确保该模型在现实世界中同样有效。谷歌和三星这两家领先的科技公司最近开始寻求用人工智能来规划一些芯片的布局的方法。谷歌的结论是,人工智能设计的芯片“在所有关键指标上都优于或相当于人类生产的芯片,包括功耗、性能和芯片面积。”而且,该公司更进一步,利用人工智能设计了下一代人工智能加速器(TPU,不像标准CPU或GPU,是为人工智能定制的芯片)。同样,三星依靠人工智能芯片设计软件制造Exynos,这是一种用于其可穿戴产品和汽车的芯片。通过高保真仿真,人工智能为科学家提供了一个强大的工具,彻底改变了他们对自然世界进行建模和实验的方式。

要测试人工智能的建模能力,现实世界中没有比新冠肺炎疫情更好的案例了。首先,蛋白质折叠算法AlphaFold正确预测了杰出的“峰值”蛋白质,显示了人工智能如何在未来的疫情中加速疫苗或疗法的研发。

但也许下面的例子更令人印象深刻。2020年夏天,日本科学家用世界上最强大的超级计算机Fugaku模拟了新冠肺炎在空中的传播。在深度神经网络和数千个GPU的支持下,Fugaku为世界提供了病毒通过空气传播的决定性证据,并说服世卫组织相应修改了控制新冠肺炎的指导方针(例如,口罩、通风以及室内与室外活动的风险)。在现实世界中,人工智能通过在危机期间为全球战略提供信息证明了其价值。

除了做出新发现和向科学武库中添加新工具,人工智能还可以发现数据中的模式,做出可测试的预测,并使用预测将新证据纳入模型。这个过程和科学方法非常相似。哲学家卡尔·波普尔(Karl Popper)曾经普及过一个观点,即科学是通过抛弃可证伪的假设(可被实验检验并证明是错误的预测)而取得进步的,而这个理论和实验相排斥的过程就是科学方法的标志。

正如最近人工智能的一些突破所表明的那样,这种技术还会生成能够通过实验测试的假设,并通过排除的过程给出严格的、可证伪的答案。DeepMind的电子密度模型通过接近科学过程,在预测和实验反馈之间反复迭代,直到更好地掌握量子计算,最终打败了研究人员。至于蛋白质折叠问题,人工智能的方法是用经过上千次实验确定的蛋白质来检验自己的模型,不断完善自己的猜测,给更接近解的分支更大的权重,从而修改神经网络。在研究人员开发出AlphaFold的开源版本后,其他科学家已经利用这个模型解决了新的难题,例如RNA结构是如何折叠的,蛋白质是如何结合的。

总的来说,了解蛋白质的组合为强大的新药创新打开了大门,因为许多细胞反应都是蛋白质协同作用的结果。这两项进步都开启了治疗设计的新时代,使人类能够利用端到端的人工智能通道,为疾病设计精准的治疗方案。例如,华为人工智能实验室的一个研究团队使用这种模型的一个版本来自动生成针对受感染目标的抗体。从药物设计到蛋白质组合,人工智能对自然的建模、分析和控制能力只会越来越强。

DeepMind的最新突破是应用人工智能处理核聚变反应的控制和维护。人工智能成功控制了氢氦聚变的反应,正是这种反应在创纪录的时间内为宇宙中的每一颗恒星提供了动力。而且,人工智能还发现了一种新形式的稳定等离子体。这项实验是开发可行的聚变能源的重要一步,可以提供足够的可再生能源为世界供电。这个案例凸显了人工智能在科学中最有前途的应用:它看到了我们看不到的模式,并从不同但互补的角度分析了我们的环境。通过与研究人员的合作,并基于科学方法,人工智能可以通过使用支持科学过程的迭代理论和实验来解决相同的探索性问题。

对科学最好的描述就是探索未知。在这个旅程中,人工智能是我们的伙伴。它以不同于人类的方式感知自然世界及其未探索的部分,从而开辟了一种理解和利用我们世界的力量的新途径。正如索尼研究总监平冈拓晃·北野所说,科学发现是一个“搜索”问题,基于假设、实验和数据的自我修正系统,可以被人工智能模仿。人工智能通过自动化和算法,可以把人类无法建立联系的原因和相关性联系起来。但人工智能不仅是科学家手中的有力工具,也是搜索路上的伙伴。人工智能还改变了科学过程,自动化了人们可以用它完成的事情,并走得更远。人工智能正在引领一场新的科学革命,在许多领域取得重大突破,为科学开辟新的道路,加快科学创新的步伐。作为科学发现的伙伴,人工智能和科学家可以一起探索无尽的科学前沿。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章