面对经典对局,目前最有价值的动作或许是:建立自己的观察框架和验证机制,而不是盲目跟随热点。
Scientific American以“amateur armed with ChatGPT”报道此事,Jared Lichtman称其思路接近Erdős“上帝之书”中最优雅的证明,陶哲轩则迅速将其扩展为更广的理论雏形。网友热议AI正民主化数学,让无专业训练者也能触及顶级难题。表面上看,这像是一场业余者逆袭的励志故事,但忽略了关键细节:AI生成的原始论证“其实很烂”,需要专家仔细筛选才能挖掘出其真实意图。
短期内,这一事件已推动Erdős问题网站更新状态,证明在Lean中完成形式化验证,数学社区开始测试类似“簇集”问题是否也能受益于AI辅助视角。长期来看,它暗示AI+人类协作的新范式可能降低高端研究的入门门槛,让更多业余爱好者贡献粗糙但有洞见的输出,而专家负责提炼与扩展。不过,如果AI输出始终依赖顶尖人类完善环节,它究竟会加速发现节奏,还是主要改变节奏,目前数据尚不足以下定论。
Liam Price和朋友Kevin Barreto则习惯“vibe mathing”,即用直觉式简单提问把开放问题扔给AI玩玩,没想到这次直接命中。
这次突破的长期影响值得持续跟踪。如果类似单提示加纯分析重构的方法在数论其他簇问题中扩散,业余玩家或AI工具参与纯数学前沿的门槛可能会进一步降低;反之,它也可能仍停留在个别亮眼案例。无论如何,它已让erdosproblems.com上的开放列表多了一个已解决标记,并为形式化验证如Lean提供了新素材。
但这些报道往往停留在“AI强大”或“业余选手也能破题”的惊叹,较少触及这次证明的真正差异:AI不再复述已有路径,而是直接生成全新公式用法。
Erdős问题1196关注原始集(primitive sets)中整数的Erdős和行为,即对于只包含足够大整数的集合,∑ 1/(a log a) 的渐近上界。之前Lichtman等人已给出较弱版本的上界约1.399+o(1),但精确控制一直悬而未决。Liam Price对这些背景几乎一无所知,他只是随意把开放问题扔给模型测试,没想到模型意外应用了von Mangoldt函数结合下行可除性Markov链的方法,避开了人类常见的分析路径。
另一个关键维度是计算可验证性。数论中的子集和问题或埃及分数分解变体,往往允许通过Python脚本或SymPy进行小n范围验证。近期AI贡献案例表明,模型在生成动态规划代码或符号计算路径上表现出色,但最终仍需Lean形式化或人工校验以排除细微漏洞。这一点目前行业内仍有不同声音——部分人认为AI更多是在“发现”已有文献,而非真正原创。
AI输出的证明虽显粗糙,逻辑存在跳跃,但意外调用了von Mangoldt函数这一经典工具,以一种人类此前未曾尝试的纯解析方式处理问题。随后,陶哲轩和Jared Lichtman等专家从中提炼出核心洞见,显著缩短并严谨化了证明,最终确认猜想成立。Erdős问题网站已更新状态,并在Lean中启动形式化验证。
对比整个流程,AI更像一把“武装业余者”的工具,而非独立证明机。它擅长生成大量变体、尝试反直觉路径,有时能撞上人类因路径依赖而忽略的死角。但输出质量不稳定,逻辑完整性和细节严谨性仍需大量人工干预。Lichtman提到,这份输出需要专家深入挖掘价值;陶哲轩则视其为发现新思考大数方式的契机。
传统研究路径往往从分析视角切入,再自然过渡到概率解释,这种“gambit”自Erdős 1935年论文以来就隐含其中,看似高效却遮蔽了其他可能性。Lichtman 2022-2023年的工作已取得部分上界成果,但精细控制仍卡在分析难度上。
数据支持这个判断,但样本的覆盖面仍有局限。