太短信息不足,太长又容易被用户跳过。
对数学社区而言,这一事件凸显了“vibe prompting”这类非严谨提示方式的潜力。更多业余爱好者和年轻研究者可能尝试类似随意描述问题感觉与目标的做法,而专家则需投入额外精力筛查AI输出中的真正洞见与潜在不严谨之处。短期内,开放平台如Erdős问题网站或将加速更新候选证明;长期来看,数学研究的参与门槛或许会进一步降低,普通人掌握有效提示技巧后也能贡献原创思路。但数据支持这个方向,同时也提醒我们,人类深度验证仍是不可或缺的环节。
岁业余爱好者Liam Price没有高等数学训练背景,却在一个普通下午用ChatGPT(GPT-5.4 Pro)的一个Prompt,输出了困扰数论界近60年的Erdős问题1196证明。专家包括Terence Tao和Jared Lichtman验证后确认有效,这个原始集相关猜想终于有了肯定解答。表面看是“业余+AI”打破纪录,但更深层意义在于AI绕开了人类长期依赖的分析路径,揭示了数论中可能存在的集体思维盲区。
另一关键标准是可计算验证性。允许有限枚举或生成数据的题目,AI能通过迭代脚本快速检查猜想,而人类手动穷举往往力不从心。子集和相关变体就是典型:给定集合,子集和是否唯一或满足特定条件,网站上部分已有下界结果,OEIS提供序列支持。让模型编写动态规划代码,枚举n在10-20范围内的实例,再分析输出模式,常常能发现人类忽略的规律。这个过程不只推进问题,还能直观展示AI在离散优化上的效率。
对比整个流程,AI更像一把“武装业余者”的工具,而非独立证明机。它擅长生成大量变体、尝试反直觉路径,有时能撞上人类因路径依赖而忽略的死角。但输出质量不稳定,逻辑完整性和细节严谨性仍需大量人工干预。Lichtman提到,这份输出需要专家深入挖掘价值;陶哲轩则视其为发现新思考大数方式的契机。
短期看,这一现象会激发更多业余爱好者和研究者尝试vibe math,加速Erdős问题攻克。erdosproblems.com上类似实验已增多,证明需Lean等形式化验证把关。长期而言,如果更多突破出现,它可能催生新的数学思考方式,帮助重新理解大数结构中的隐含联系。不过,AI原始输出仍需专家精炼,其作用更像新连接方法的提供者,而非独立证明者。
最近,23岁的业余玩家Liam Price仅用GPT-5.4 Pro一个提示,就让困扰数学界近60年的Erdős问题1196有了突破性证明。这条消息迅速在Hacker News和erdosproblems.com论坛引发热议,Scientific American也以“vibe mathing”为题报道了这一案例。Price没有接受过高级数学训练,却让模型在约80分钟内生成一份草稿,随后经专家精炼并在Lean中形式化验证。
从影响预判看,短期内erdosproblems.com可能迎来更多业余者尝试“AI-for-Erdős”方法,问题解决速度有望加快,社区讨论已显示类似提示技巧分享在增加。长期而言,研究范式或从孤立精英主导转向更广泛的协作,但也伴随新挑战:如果专家审查跟不上海量生成内容,伪证明风险可能上升。目前社区要求透明披露AI使用并鼓励把关,这是一种积极探索,却未必能轻松规模化。数据支持这个方向,但样本量仍有限,值得持续跟踪,现在下结论为时尚早。
表面上,这件事被媒体和网友迅速包装成“业余+AI轻松破难题”的故事。不少报道强调“23岁小伙一键破解60年老问题”,Hacker News和Reddit上热议AI是否即将取代专业数学家,或者它只是一个高效工具。部分观点兴奋于数学研究门槛降低,另一些则担忧传统严谨证明路径会被随意“vibe mathing”取代。这些讨论抓住了事件的戏剧性,却往往停留在结果层面。
人类数学家并非缺乏能力,而是长期在标准招式中打转,形成了某种集体mental block。过去类似组合或聚类问题上,也曾出现专家直觉集体偏向某个方向,结果新视角出现后才发现原来可以更简洁。Tao的评论值得注意:AI无意中突出了整数“解剖学”与某些过程之间更紧的联系,这可能比单纯解题本身更有价值。数据支持这个方向,但样本量仍有限,类似突破是否能系统复现仍需观察。
从更广层面看,这种人机协作正在重塑数学研究的分布式模式。短期内,erdosproblems.com的访问量和尝试案例可能显著增加,更多业余者会涌入,用类似直觉提示方法测试其他开放问题。长期而言,研究范式可能从孤立精英主导转向更开放的协作网络,对普通爱好者来说,高级数学的心理壁垒有所降低——不再需要完整博士路径,就能通过实践体验研究乐趣。但这也带来新变量:如果提示技巧普及,普通贡献或成常态;
数据与现实之间的落差,值得每一位观察者重视。