小步快跑、快速迭代,比大刀阔斧的全面改造风险更低。
从2016年AlphaGo震撼围棋界,到如今LLM通过海量参数和数据scaling主导商业应用,AI行业走出一条清晰的数据驱动路线。这条路线带来了快速迭代和商业落地,却也积累了依赖人类存档的内在限制。Silver的创业选择将“数据范式”与“经验范式”置于直接对立:前者依赖互联网文本等现成素材,后者强调与环境的交互迭代。这一分歧并非技术细节之争,而是关乎通往AGI路径的根本路线之争。
Silver在公开表态中反复强调,从人类数据时代转向经验时代,才是通往真正超级智能的可持续路径。他把强化学习视作“从第一性原理构建智能”的方式,能像达尔文解释生命那样,解释并构建所有智能。这个观点锐利,却并非空谈——AlphaZero的零数据超人类表现已提供实证。不过,现实世界的复杂性远超棋盘,奖励信号的定义往往需要大量工程努力,训练过程也充满波动。
多数媒体和行业观察者将焦点放在DeepMind核心人才流失、欧洲AI史上最大种子轮,以及顶级VC对新型计算需求的认可上。网友评论往往停留在“大牛创业拿大钱”的惊叹,或感慨顶级研究员从大厂出走的大势。Nvidia参与也被解读为对海量模拟计算的提前布局。然而,这些表面叙事容易掩盖更根本的分歧:Silver为何在AlphaGo成功十年后,仍坚持认为只靠人类数据喂养的LLM存在结构天花板,而纯强化学习的经验范式才可能突破现有知识边界。
对2026年的AI创业者而言,这里隐含的技术路径启示在于评估方式的转变。不要盲目跟随主流继续堆参数、扩数据,而是优先判断项目能否构建起有效的“trial-and-error + world model”闭环。如果能在模拟环境中让AI自主探索,长期可能避开数据天花板。当然,这条路的风险同样存在——强化学习在复杂现实任务中的样本效率和稳定性仍有待大规模验证,棋类游戏的成功模式并不容易直接泛化到所有场景。
长期而言,若Ineffable的“超级学习者”路径获得验证,将推动行业超越纯人类数据依赖的瓶颈,对技术路线与人才估值产生重塑。同时,强化学习专长人才的稀缺性将进一步凸显。不确定性依然存在:如果技术验证周期拉长,早期高估值或引发部分人才回流;如果成功,则可能刺激更多类似巨额种子轮,进一步加速实验室向创业公司的转化。值得持续跟踪,现在下结论为时尚早。
他和Richard Sutton的合作论文《Welcome to the Era of Experience》已清晰指出,AI正站在从静态数据转向动态经验的门槛上。
行业观察多年,我个人更倾向于认为强化学习将成为AI长期范式的关键补充,甚至潜在替代。人类数据时代已接近尾声,再怎么合成或精炼,也绕不开内在局限。只有让AI通过自我试错生成可持续经验,才可能实现质的智能跃迁。这个方向是对的,但执行难度远高于表面。AI下一站究竟会如何演进,仍需观察Ineffable Intelligence后续的技术落地。
AlphaGo之父David Silver从DeepMind离职的消息,迅速在AI圈掀起波澜。2025年底,这位曾主导AlphaGo和AlphaZero研发的核心人物正式离开Google旗下实验室,创办伦敦AI初创公司Ineffable Intelligence。进入2026年4月,公司仅成立数月便完成1.1亿美元种子轮融资,估值达51亿美元,领投方包括Sequoia和Lightspeed,Nvidia、Google等机构跟投。
年4月,AI融资市场再次出现一笔引人注目的早期交易。前Google DeepMind强化学习团队核心负责人David Silver创办的Ineffable Intelligence,在成立短短几个月后,便完成了1.1亿美元规模的种子轮融资,估值达到51亿美元。
表面上看,这件事被许多媒体和行业评论解读为名人效应与资本热潮的结合。David Silver凭借AlphaGo和AlphaZero等强化学习经典成果积累的声誉,成为强大背书;Ineffable宣称要打造“superlearner”,通过自身经验发现所有知识,而非依赖海量人类数据。投资者显然看好其超越当前LLM路径的潜力,Sequoia和Nvidia的加入尤其引人注目。
谁有1元1分跑的快群的未来,仍需持续观察。