“没错!”乔什嘆了口气,“我记得他连毙了八篇號称证明了n-s方程的论文,现在全世界的数学家都以为他已经闭死关,准备亲自跟千禧难题搏命了,结果他一声不吭,跑来投neurips”
“谁知道呢”麦可的语气中带著一丝无奈的自嘲,“也许是手算微分流形算到大脑快过载了,顺手写篇ai顶会论文当做调剂放鬆一下这种跨界怪物的脑迴路,本来就不是我们能揣测的。你还是先看看正文吧。”
……
乔什深呼一口气,重新戴上眼镜,开始认真阅读论文的核心內容。
按照常理,计算机顶会的论文,大家通常第一眼看的是当前最优效果的跑分图表和工程架构图。但这篇论文,完全不按套路出牌。整篇文章几乎找不到一张常规的实验跑分图,取而代之的,是满篇令人头皮发麻的高深数学推导!
仅仅翻过前两页,这位it的资深教授就眉头紧锁。他的呼吸变得急促起来,滑鼠滚轮快速滑动,似乎在確认自己没有看错某些关键的数学推导。
“麦可……“乔什对著麦克风难以置信地说道,“他用德拉姆上同调来处理长序列注意力的衰减问题“
“不仅如此,”乔丹在屏幕那头苦笑著敲了敲键盘,將屏幕共享了过来,用红笔圈出了一个极其复杂的张量公式,“他把整个d-ltn框架的记忆解耦问题,变成了寻找流形上调和形式的纯数学问题!“
乔什看著屏幕上的推导,声音里带著某种被击碎的感觉:“这意味著……他用泛函分析证明了在理想条件下,记忆与计算可以做到完全的零损耗解耦。“
视频会议的两端陷入了短暂的死寂。两位大师级的学者对视了许久,最终只能互相交换一个苦笑。
“梁文锋的那个开源方案,“乔什终於开口,“本质上是在现有硬体限制下,做的工程妥协。但这……“他指向电脑屏幕,“这是在告诉我们理论上的绝对最优解应该是什么样的。“
“问题是,“乔丹关闭了屏幕共享,“在目前的gpu硬体架构下,他这个方案的工程落地成本高到离谱。可能需要重新设计晶片架构才能真正发挥这套理论的潜力。在现在的ai圈子里,这种缺乏实际跑分支撑的纯理论文章,按理说是要吃亏的。“
“那又怎样“乔什毫不犹豫地在审稿系统里敲下了“stro(强烈接收)“的评级,“从理论高度来说,这篇论文把整个ai记忆网络机制的上限,硬生生拔高了至少十年。这就足够了。“
乔丹看著乔什这边的系统状態同步更新,缓缓点了点头。
“这小子,不仅在数学界是个怪物,在计算机领域也完全不按常理出牌。用纯数学降维打击计算机理论,我们连给他挑逻辑漏洞的资格都没有。毕竟我的数学水平只够算算矩阵乘法,难道还能去反驳一个菲尔兹奖得主的流形拓扑”
麦可在自己的评审栏里也打下了同样的评级,“如果这篇论文都被拒,neurips今年的公信力可以直接破產。“
“同意。“乔什回应道,“麦可,下个月的学术峰会你应该会来波士顿吧到时候咱们需要好好聊聊,这种人的出现,,对整个ai圈的学术生態到底意味著什么。”
……