David Silver为何押注“经验时代”而非人类数据?AI范式转变
- 发布时间:2026-04-28 05:20:04
- 来源:一元一分线上红中麻将群资讯中心
- 栏目:新闻资讯
搜索引擎算法对一元一分线上红中麻将群的理解深度持续增加。
Silver与Richard Sutton合作的论文《Welcome to the Era of Experience》为这一转向提供了理论框架。Sutton的经典《The Bitter Lesson》早已指出,AI历史上短期依赖人类知识注入的方法虽有效,但长期总被纯计算驱动的方法超越。人类数据虽庞大,却本质上是有限的快照,带有内在偏见和知识天花板。
AlphaGo之父David Silver从DeepMind离职创办Ineffable Intelligence,并迅速完成1.1亿美元种子轮融资,这一事件远超单纯的人才流动。Silver长期领导强化学习团队,主导AlphaGo和AlphaZero等里程碑项目,这些系统通过自我对弈和试错实现超人类表现,而非依赖人类棋谱数据。
这件事远比又一家AI独角兽融资复杂。它直接挑战了当前LLM高度依赖海量互联网人类数据的范式,转向纯经验驱动的路径。AlphaZero曾在围棋等封闭环境中证明无人类数据也能达到超人类水平,但将这一机制扩展到开放世界,技术鸿沟明摆着的。
但若只停留在名人效应与资本狂热层面,很容易错过更本质的信号。Silver的转向,实质是从“人类数据时代”迈向“经验时代”的尝试,这与AlphaZero从随机自对弈中超越人类棋谱的逻辑一脉相承。创业者需审视自家技术栈:是否能构建有效的trial-and-error闭环与世界模型,而非单纯堆积参数或标注数据。
这种“化石燃料式” shortcut 带来了便利,却也埋下了明显上限:数据质量逐渐见顶,高品质训练数据越来越稀缺,模型容易产生幻觉,且难以生成真正超越人类已知边界的创新。
计算资源是否能跟上经验生成的规模,以及对齐机制能否有效约束超级学习者的行为,仍是转型路上的关键变量。数据支持经验时代的方向,但样本和实际落地案例尚有限。值得持续跟踪的是,这一范式切换能否真正让AI从“模仿人类”转向自主发现未知。如果障碍逐步清除,AI发展的长期轨迹或将被重塑。
年4月27日TechCrunch报道,DeepMind强化学习元老David Silver创办的Ineffable Intelligence仅数月便完成1.1亿美元种子轮融资,估值达到51亿美元。公司核心目标是打造“超级学习者”,完全通过强化学习从自身反复试错中自主发现知识,而非依赖人类生成的数据。
多数报道将焦点放在人才流失与融资规模上。DeepMind强化学习团队负责人出走,被视为欧洲AI史上最大种子轮之一;行业评论多惊叹估值与投资者阵容,网友则感慨“大牛创业”或预测计算资源需求激增。然而,这些表面叙事往往停留在钱与人的层面,较少触及Silver为何在AlphaGo系列成功后,仍选择放弃大厂稳定路径,转向纯强化学习驱动的“superlearner”。
主流报道多将焦点放在融资规模、Silver的AlphaGo与AlphaZero履历,以及Ineffable“首次接触超级智能”的口号上。投资者阵容确实豪华,网友也感慨这是欧洲AI难得的里程碑,有人讨论强化学习能否挑战LLM的主导地位。这些观察捕捉到了表面热闹,却往往忽略了Silver此举的核心逻辑:他不是在追逐热门赛道,而是基于多年实践,认定依赖静态人类数据的范式已显疲态。
AlphaZero的实践提供了生动注脚。它从零开始,只掌握围棋规则,不吃任何人类棋谱,通过自我对弈和强化学习,短短几天便达到超人类水平,发现了人类棋手未曾探索的新策略。这一过程打破了“吃老本”的模仿路径,证明纯经验驱动能突破人类知识天花板。Silver如今将这一思路扩展到更广阔的智能领域。
但现实更复杂,技术进步之外的组织因素常常起到关键作用。
固定链接:http://www.bbb.cn.ww5.ss7a.cn/6411.html
说明:本页为频道内容整理与信息归档页面,便于围绕当前主题做连续查阅与延伸阅读。