量子位 08-21
爆火神经网络架构KAN更新2.0!研究者可专属定制,轻松应对经典物理学研究,作者:和MLP不能互相取代
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

,上新了!

KAN2.0

此次与科学问题更深入地融合,可以轻松解出经典物理学研究。

比如发现拉格朗日量(用来描述整个物理系统动力状态的函数)

除此之外,研究者还可以量身定制属于自己的 KAN2.0,将专业知识作为辅助变量添加到输入当中去。

此前,KAN 横空出世,一夜引爆科技圈。它以 200 万参数模型架构,直接复现 DeepMind 用 30 万参数的 MLPs 发现数学定理的研究。要知道,后者可是登上 Nature 封面的研究。

由于 KAN 性能太好,一度引来关于「能否替代掉 Transformer 的 MLP 层」的探讨,大家直呼:Yes We KAN!

MIT 博士生刘子鸣再次为论文一作。

业内学者们,纷纷赶来祝贺。

KAN2.0 将 AI 与科学统一起来

AI+ 科学的一大挑战在于他们之间固有的不兼容性:当前 AI 主要基于连接主义,科学则依赖于符号主义。

此次新框架 KAN2.0 就主打将 KANs 同科学无缝协同,这种协同作用是双向的:科学到 KAN(将科学知识融入 KAN)KAN 到科学(从 KAN 中提取科学见解)

更具体来说,KAN2.0 对科学发现主要有三个方面的作用,从简单粗略到逐渐精细复杂:

识别重要特征揭示模块结构发现符号公式

在原始 KAN 基础上主要引入了这三个新功能。

1、MultKAN:带有乘法节点的 KAN

2、kanpiler:将符号公式编译成 KAN 的编译器

3、树转化器,将 KAN2.0 架构(或任何神经网络)转换为树状图

跟上一版本相比,KAN2.0 的解释性更通用,比如像化学、生物学等这种很难用符号方程表示的,模块化结构和关键特征能够来描述。

比如,用户可以将模块化结构构建到 KAN2.0 中。

再通过 KAN2.0 同 MLP 神经元交换,就可以直接看到模块化结构。

此外,团队探究了如何将先验知识融入 KAN2.0。

基于这些更新,团队展示了 KAN2.0 发现各种经典物理定律的能力。

比如发现二维谐振子的守恒量。

利用 MLP 和 KAN2.0 重新发现史瓦西黑洞的隐藏对称性。

还有像通过与 KAN2.0 交互,发现构造定律。

接下来,团队有两个方向:一是将该框架应用于更大规模的问题;二是将其扩展到物理学以外的其他科学学科。

MIT 华人一作

此次研究来自 MIT、加州理工学院、MIT CSAIL 等机构的五位研究者,共有三位华人。

相比于 KAN 初始版本,还有不少原班人马,其中 MIT 刘子鸣依然为一作。

刘子鸣目前是 MIT 四年级博士生,Max Tegmark 是他的导师,其研究兴趣在于人工智能与物理学的交叉领域,具体像 AI 科学家、物理学启发的深度学习、深度学习科学、机械可解释性等。

由于 KAN 受到广泛的关注,作为核心作者,他在 GitHub 页面上特意注明,在设计 KAN 并编写代码的时候,考虑的是数学和物理示例(规模相当小!)因此没有考虑到效率而可重用性方面的优化。

对于专注机器学习的用户,他坦言,KAN 可能还不是个可以开箱即用的简单插件(目前还不是)。

KAN 和 MLP 不能互相取代,他们在某些情况下各有优势,在其他情况下也有局限性。

好了,感兴趣的小伙伴,可戳下方链接了解更多 ~

论文链接:

https://arxiv.org/abs/2408.10205

参考链接:

[ 1 ] https://github.com/KindXiaoming/pykan?tab=readme-ov-file

[ 2 ] https://kindxiaoming.github.io/

[ 3 ] https://x.com/ZimingLiu11/status/1825731703723405757

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

神经网络 mit 物理 公式
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论