我们会把观察到的现象先摆出来,供你参考。
这件事远比又一家AI独角兽融资复杂。它直接挑战了当前LLM高度依赖海量互联网人类数据的范式,转向纯经验驱动的路径。AlphaZero曾在围棋等封闭环境中证明无人类数据也能达到超人类水平,但将这一机制扩展到开放世界,技术鸿沟明摆着的。
媒体报道普遍聚焦Silver的传奇履历:他主导开发的AlphaGo和AlphaZero,通过纯自对弈从零掌握复杂游戏规则,无需任何人类棋谱指导。公司网站将这一雄心比作“媲美达尔文定律的突破”,意在解释并构建所有智能。多数业内观点视此为RL对LLM的正面冲击,乐观者认为它可能开辟通往超级智能的新路径。
AlphaZero的实践为这一判断提供了生动注脚。该系统从零开始,只掌握规则,不摄入任何人类棋谱,却通过自我对弈和强化学习在短时间内达到超人类水平。它发现的策略甚至改变了人类棋手对围棋和国际象棋的理解。这不是孤例,而是经验驱动范式突破人类知识天花板的缩影。Silver的Ineffable战略,正是将这种从随机探索到精妙发现的过程,扩展到更开放的智能领域。
前DeepMind强化学习负责人David Silver创办Ineffable Intelligence,仅数月就以51亿美元估值完成11亿美元种子轮融资,由Sequoia Capital和Lightspeed领投,Nvidia、Google及英国政府相关基金参投。
70%和7%——如果类比企业AI部署的计划率与规模化率,这个剪刀差或许正预示着当前范式的瓶颈。值得持续跟踪,现在下结论为时尚早,但Silver的1.1B融资已为我们留下一个开放的问题:AI下一站,究竟是继续在人类数据上卷,还是勇敢拥抱经验学习的未知?
David Silver创办Ineffable Intelligence仅数月,便以51亿美元估值完成11亿美元种子轮融资,由Sequoia和Lightspeed领投,Nvidia、Google及英国政府等机构跟进。这笔欧洲史上最大种子轮的背后,并非单纯资本追逐明星创始人,而是他对AI发展路径的一次方向性押注:从依赖海量人类数据的“数据时代”,转向通过强化学习自主生成经验的“经验时代”。
表面看,这是一笔欧洲AI史上罕见的早期大额融资,但其核心在于Silver对路径的选择:放弃大厂稳定的scaling LLMs框架,转向纯强化学习驱动的“superlearner”。这件事远不止人才流动那么简单,它直接触及当前AI主流信仰的脆弱点。
Silver在公开表态中反复强调,从人类数据时代转向经验时代,才是通往真正超级智能的可持续路径。他把强化学习视作“从第一性原理构建智能”的方式,能像达尔文解释生命那样,解释并构建所有智能。这个观点锐利,却并非空谈——AlphaZero的零数据超人类表现已提供实证。不过,现实世界的复杂性远超棋盘,奖励信号的定义往往需要大量工程努力,训练过程也充满波动。
长期而言,若Ineffable的“超级学习者”路径获得验证,将推动行业超越纯人类数据依赖的瓶颈,对技术路线与人才估值产生重塑。同时,强化学习专长人才的稀缺性将进一步凸显。不确定性依然存在:如果技术验证周期拉长,早期高估值或引发部分人才回流;如果成功,则可能刺激更多类似巨额种子轮,进一步加速实验室向创业公司的转化。值得持续跟踪,现在下结论为时尚早。
值得持续跟踪的是,这条强化学习主导的“经验时代”路径能否在复杂现实任务中实现有效泛化。数据支持自主学习的方向,但样本效率和奖励函数设计等挑战依然存在。如果成功,或许会重塑AI从“阅读人类知识”到“自主探索世界”的范式;若验证周期过长,许多项目可能仍需回落到LLM与强化学习的混合路线。
关键局策略的布局,建议以稳健为主,激进操作的空间正在收窄。