零字节资讯网2025年11月5日消息:

人工智能如何助力(而非阻碍)物理学

0

分享至

用微信扫码二维码

分享至好友和朋友圈


中国科学院国家天文台 苟利军 编译自 Tara Shears.

Physics World

,2025,(9):20)

本文选自《物理》2025年第10期

人工智能在物理学中的应用已屡见不鲜,但物理学是否也能反过来帮助人工智能?英国物理学会最近发布了一份调研与报告,塔拉·谢尔斯(Tara Shears)在这份报告中探讨了这两个领域之间的关系。

套用简·奥斯汀(Jane Austen)的名言:凡是拥有庞大数据集的科研项目,必定“渴望”人工智能(artificial intelligence,AI)的助力。

费米实验室对撞机探测器(CDF)是一个大型国际合作项目,聚集了来自15个国家约60家机构的科学家。其中一支团队来自德国的卡尔斯鲁厄大学(现为卡尔斯鲁厄理工学院),他们试图在对撞机的数据中分辨出底夸克(译者注:bottom quark,又被称为美夸克,beauty quark)的物质与反物质类型。这项任务出了名的困难——背景噪声极高,信号极其微弱,而数据量庞大。更棘手的是,在许多变量上,信号与背景之间仅存在细微差异。

面对这样的数据挑战,该团队的Michael Feindt教授开发了一种神经网络算法来解决问题。这类算法模仿人脑中神经元的学习方式,能够通过训练识别数据中的模式。Feindt的神经网络在使用合适的信号与背景样本进行训练后,能够有效地区分二者,并以最优方式结合变量,从而识别出物质与反物质的底夸克。

在当时,这项工作之所以引人注目,仅仅是因为它提供了一种全新的思路:如何在庞大的噪声背景中提取微弱信号。然而事实证明,这一神经网络成为对撞机探测器诸多物理成果的重要基石,其中就包括具有里程碑意义的发现——Bs介子(由反底夸克与奇异夸克组成的粒子)在物质与反物质形态之间的振荡。

此后,该算法的改进版本被广泛应用于其他场合,包括欧洲核子研究中心大型强子对撞机(LHC)的四大实验中的三项。在每一个案例中,这种方法都让研究人员能够以更少的数据提取更多的信息,从而加快了科学进展的步伐。

更有意思的是,这种神经网络方法的受益范围远不止粒子物理学,它还曾短暂地被应用于对冲基金管理以及汽车保险费率预测。后来,一家名为菲-T(Phi-T,之后改名为蓝色远方,BlueYonder)的公司从卡尔斯鲁厄大学孵化出来,并将该算法应用于供应链物流优化。经过几轮收购,这家公司如今已成为屡获殊荣的全球性企业。而这套神经网络却依然免费供粒子物理学家们使用。

双向大道。机器学习算法在分析大型物理实验产生的海量数据时极为宝贵。但与此同时,物理学也推动了许多人工智能技术的发展

从实验室到客厅

如今,许多类型的神经网络和其他人工智能方法已被常规地用于获取和分析粒子物理数据。事实上,我们的数据集庞大到必须依赖计算机的帮助,它们的使用已经从“新奇之举”变为“必不可少”。

可以让你感受一下数据规模之大,在LHC的下一轮运行期间,其实验预计每年会产生约2000拍字节(2×1018字节)的真实与模拟数据,从而供研究者分析。这一数据量几乎是YouTube上一年上传视频总量的10倍,是谷歌年度网页数据集的30倍,相当于Outlook一年邮件流量的三分之一以上。这样的数据规模,毫无疑问需要人工智能来进行分析。

粒子物理或许是人工智能的早期应用者,但如今AI已经广泛渗透到整个物理学领域。这并不令人意外。物理学本身数据量巨大、计算密集,因此在数据分析、物理系统模拟,以及复杂实验的自动化控制等方面,都能显著受益于人工智能带来的速度提升和计算能力。

例如,在天文巡天中,人工智能已被用于对引力透镜图像进行分类。它帮助研究人员在不同的暗能量模型下,对观测到的物质分布进行解释。实际上,2024年时,AI让暗能量巡天的研究成果有了相当于数据样本量翻四倍的提升(详见“AI宇宙”)。

人工智能甚至帮助设计了新材料。2023年,谷歌DeepMind发现了数百万种可能支撑未来技术发展的新晶体,这一成果相当于800年的研究积累。而且还有许多类似的突破——AI已成为加速科学进展的一股强大力量。

但人工智能并不局限于复杂的实验。事实上,我们每天都在使用它。AI为网络搜索提供动力,帮助人们理解概念,甚至有时通过传递错误信息让人们产生误解。如今,AI已经渗透到生活的方方面面,每一次出现都同时带来挑战与机遇。

AI 宇宙

暗能量巡天合作项目已经使用AI方法来研究暗能量(被认为是驱动宇宙膨胀的神秘现象)。

此前,暗能量巡天研究人员通过分析来自星系光线的畸变,来推断光在抵达观测者之前所经过物质的引力效应,从而绘制出宇宙中的物质分布。这种分布既依赖于可见物质和暗物质(它们将星系彼此吸引),也依赖于暗能量(它使星系相互远离)。

在2024年的一项研究中,研究人员利用AI技术模拟了一系列物质分布,每一种分布对应着暗物质、暗能量及其他宇宙学参数的不同取值。随后,他们将这些模拟结果与实际观测到的物质分布进行比较。通过判断哪些模拟结果与数据相符,得以提取出相应的暗能量参数数值。

由于AI方法能够利用比传统手段更多的信息进行对比,结果也更加精确。研究人员的精度提升了一倍,相当于用以往方法增加四倍数据量才能达到的效果。

用深度学习解析黑暗宇宙。这是一个由名为“高尔街(GowerStreet)”的AI工具生成的暗物质模拟图

物理学家的声音

正是这种挑战与机遇并存的局面,让当下成为审视物理与人工智能关系的关键时刻,思考两者能够如何互相赋能。事实上,英国物理学会最近就此主题发布了一份“先导”研究报告,谢尔斯也担任了顾问。所谓“先导研究”,是对某一主题进行全景式的探索,明确后续更深入、更详细的“影响”研究应当拓展的方向。

这份先导研究的标题是《物理与AI:物理学界的视角》。它基于对英国物理学会会员的调查(调查他们对AI及其用途的态度),以及一次专家研讨会(讨论未来的创新潜力)。最终形成的报告于2025年4月发布,揭示了人工智能在物理学中已是如此广泛的应用现状。

在约700名调查参与者中,约有三分之二的人表示在某种程度上使用过AI,而且在物理学的各个分支领域,都有相当一部分人对其有所了解。最常见的是与各种机器学习方法或生成式AI相关,但也有人接触过AI伦理与政策、计算机视觉和自然语言处理。这表明AI的用途极其广泛,从非常具体的模式识别和图像分类任务,到理解它更广泛的社会影响与监管需求。

谨慎前行

尽管人工智能确实能够显著加速物理研究,但我们必须保持谨慎。正如许多调查参与者指出的那样,AI是一种强有力的辅助工具,但如果仅仅把它当作黑箱来用,并想当然地认为它会给出正确结果,这是非常危险的。AI工具本身及我们赋予它们的任务都十分复杂——我们必须确保理解它们在做什么、效果如何,才能对其结果有足够信心。

关于AI使用不当导致结果失真,有数不清的警示案例。美国麻省理工学院的Joy Adowaa Buolamwini在2017年的硕士论文中,分析了三种商用的人脸识别技术,揭示出这些算法因训练集不完整而存在性别与种族偏见。训练数据集中以白人男性面孔为主,导致有色人种女性被误判的比例高达35%,而白人男性的识别准确率却高达99%。这一发现促使IBM和微软对其算法进行了修正。

谨慎的理由。基于人工智能的人脸识别技术在黑人女性群体中的表现最差,这种偏差可能带来严重的现实负面后果。其根源在于训练数据集严重偏向白人男性

即便只是评估机器学习应用中的不确定性,也充满了复杂性。训练数据从来都不完美。例如,模拟数据可能无法完全准确地描述实验中设备的响应,或者如前例所示,若训练数据集不完整,真实数据中的关键过程就可能被遗漏。而算法的表现也从不完美,训练方式和参数选择本身都会带来不确定性。

事实上,在这份先导研究的调查中,有69%的受访者认为人工智能对物理学带来了多重风险,其中主要担忧之一就是训练数据质量差或错误导致的结果不准确(详见“对不确定性的‘不确定’”)。物理研究中若出现结果错误,可能会“发现”一个并不存在的粒子,或错过一个真正的新粒子,这已足够严重。试想一下,如果未经充分理解的AI方法被用于解读医学影像,作出医疗决策,或被用于金融投资的模型建议,其风险之大可想而知。然而,尽管后果严重,在这些现实场景中应用的AI方法往往校准不足,其不确定性也并未被清晰界定。

物理学界正考虑一些新方法,试图将源于模拟训练数据的不确定性与算法性能相关的不确定性区分开来。然而,这并不容易。美国劳伦斯伯克利国家实验室的Aishik Ghosh和Benjamin Nachman在2022年的一篇论文中指出,设计出一种方法,使其对“你认为训练数据中存在的不确定性”不敏感,并不等同于真正对“实际存在的不确定性”不敏感。如果情况如此,不仅测量不确定性会被低估,而且根据训练数据与现实之间的差异,还可能得到错误的结果。

人工智能能够、也确实在推动物理学发展,但我们必须投入时间正确地使用它,确保结果可靠。只有这样,其他领域的人们也才能从我们的工作中受益。

对不确定性的“不确定”

英国物理学会的“先导研究”调查向其成员提问:“在物理学研究与创新中,您对人工智能的最大潜在担忧是什么?”受访者可以选择多个答案,而最普遍的担忧是人工智能的不准确性。

物理学如何帮助人工智能

物理学是一个对精确度要求极高的领域,我们在理解结果中的偏差和不确定性时力求严谨。事实上,先导研究报告强调,我们量化不确定性的方法同样是能够推动和强化人工智能的方法。这对于未来的创新以及提升人们对人工智能应用的信任至关重要。

相关进展已经在展开。其中之一是2017年首次提出的“物理约束神经网络”。这种方法不仅利用与特定应用相关的训练数据,还要求模型结果必须与物理定律保持一致。引入物理规律有助于弥补训练数据的不足,并能防止出现违反物理规律的解,从而提高结果的准确性。虽然这一领域还相对年轻,但发展极为迅速,已经在计算流体力学、传热学、结构力学、期权定价以及血压估算等领域得到了应用。

另一项进展是贝叶斯神经网络的应用,它能够在预测中引入不确定性估计,从而让结果更稳健、更具意义。这种方法已经在医疗诊断和股市预测等决策至关重要的领域中进行试验。

但这对物理学来说并不陌生。早在2000年代,对撞机探测器实验中开发的神经网络就是一种早期的贝叶斯神经网络。它被设计用来抵抗数据中的离群点,避免因统计波动引起的训练问题,并以可靠的概率基础来解释结果。正是这些特性,使得这种方法在分析物理学以外的许多系统时也同样具有不可替代的价值。

因此,物理学既从人工智能中获益,也能推动人工智能的进步。这是一种独特的关系,理应得到更广泛的认可,而现在正是将其凸显出来的好时机。英国政府已经表示,它认为人工智能是“我们这一代人决定性的机遇”,能够驱动增长和创新,并希望让英国成为全球人工智能强国。相关行动计划和战略已经在实施。物理学可以提供独特的视角来助力实现这一目标,现在正是将其纳入讨论的时刻。

用先导研究报告中的话来说,我们需要清晰阐释并展示人工智能能为物理学做些什么,以及物理学能为人工智能贡献什么。让我们从这里出发,把物理学真正放上人工智能的地图,为所有人所知。

人工智能术语与定义

以下是人工智能领域一些关键术语的定义。

人工智能(AI)

由机器展现出的智能行为。但“智能”的定义颇具争议,因此一个更普遍、更容易被接受的定义是:人工智能是指系统能够根据环境和既往经验调整自身行为的能力。

机器学习

作为赋予机器人工智能的一类方法,机器学习本身是一个广泛的范畴。本质上,它是一个系统通过训练集进行学习,从而能够在面对新数据时自主做出恰当反应的过程。

训练数据

一组真实或模拟数据,用来训练机器学习算法,使其能够识别数据中表征信号或背景的模式。

人工神经网络

机器学习的一个分支,其学习机制仿照生物大脑的运作方式。输入信号在通过层层相互连接的神经元时会被不断调整,最终输出结果。“经验”通过改变网络中神经元之间连接强度的方式被“编码”。

生成式人工智能

一种机器学习算法,它能够基于训练数据生成新的内容,如图像或文本。

计算机视觉

人工智能的一个分支,通过分析、解读和提取图像中的有用信息来识别和分类对象与模式。

自然语言处理

人工智能的一个分支,负责分析、理解和生成自然语言。

《物理》50年精选文章

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/阅读下一篇/

返回网易首页
下载网易新闻客户端

请继续点击阅读以下震撼之作:
136幅锁魂 ×21密钥开玄
伊甸园真容现世新疆于阗


点击上面零字节资讯网相机的圆圈
生成这篇文章的奇异、神秘的海报
然后将海报保存图片收藏,可发朋友圈
本文来自网络,不代表零字节网立场,
转载请注明出处:零字节网(0b.cn)

此文由访客“中国玉王”发布
“中国玉王”发布的所有文章
“中国玉王”提供的交易链接

我要在零字节网做自媒体, 发布内容

点击查看中国前沿资讯更多内容
联系我们

联系我们

18999110818

在线咨询: QQ交谈

邮箱: 515910221@qq.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们


资讯首页 手镯检索 玉王易经