这个观察在多个站点数据中得到印证。
主动实验选择方法则提供了Spend Less, Fit Better的路径。该方法将Scaling Law拟合建模为budget-aware sequential experimental design,在有限候选实验池中,针对每个run的异构成本,顺序选择执行顺序以最大化高成本目标区域的外推精度。
在大模型训练预算规划中,Scaling Law扮演着关键角色,帮助团队预测不同规模下性能表现,从而指导数百万甚至上亿美元的投入。但拟合这些规律本身往往需要大量pilot实验,累计成本同样不菲。arXiv最新论文《Spend Less, Fit Better》提出了一种预算感知的主动实验选择方法,通过不确定性驱动的顺序设计,在非线性Scaling Law中针对多盆地问题实现高效拟合,用远低于传统方式的资源接近全实验集的外推准确性。
论文作者还开源了相关代码,仓库位于GitHub的PlanarG/active-sl,为研究者和工程师提供了落地基础。实践中,团队可从拉丁超立方采样启动少量低成本实验构建初始模型,再迭代应用采集函数指导后续选择。这种序贯流程不仅压缩了预算,还让每一分计算资源都服务于高价值外推。数据显示,在lr&bsz任务上,该方法能在极低预算下逼近最优低损耗区域。
实验结果显示,在多个benchmark上,该方法用约10%的总训练预算,就能接近全集拟合的性能,尤其在目标区域R²指标上达到90%以上水平。这与历史Scaling Law拟合案例形成鲜明对比——过去团队常因盲目采样浪费资源,而新方法把百万级预算问题转化为可控序列决策。方向是对的,但盆估计准确性和实际成本建模仍需注意。
最近几天,arXiv上这篇题为《Spend Less, Fit Better: Budget-Efficient Scaling Law Fitting via Active Experiment Selection》的论文在机器学习圈引发了不少讨论。Scaling Law常被用来规划百万美元级的大模型训练,但拟合这些定律本身的试点实验,成本同样可能达到百万级别。
传统Scaling Law拟合的代价远超想象。根据arXiv最新预印本,许多团队依赖被动或经典实验设计,如均匀采样或基于D-optimality、V-optimality的策略。这些方法在实验成本高度异构时信息效率低下——低成本区域往往被过度填充,而高成本目标区域的外推精度却迟迟无法提升。常见误区是认为“多跑几个实验总归更准”,但现实中大量预算浪费在信息增益有限的试点上,导致高价值外推区域偏差明显。
这件事比表面“省钱”复杂得多,尤其对正流行参数高效MoE架构的团队而言。主动实验虽能大幅压缩pilot开销,却依赖于实验池的合理构建和采集函数的鲁棒性。未来如果能更好融入shared experts等MoE特有因素,整体训练预算利用率或有明显提升;反之,高精度外推或许仍会集中在资源充裕的玩家手中。
论文方法论的核心在于把拟合过程转化为主动、顺序的决策过程。给定候选实验池后,系统先分解目标区域的预测不确定性——包括盆地内部方差(intra-basin)和盆地间分歧(inter-basin)。随后用cost-aware score排序:预期误差降低量除以成本(附加惩罚),优先执行那些能同时削减两种不确定性且性价比高的实验。跑完一个后更新后验,再决定下一个,逐步收敛。
这篇论文将Scaling Law拟合重构为预算感知的序贯实验设计问题:在有限候选实验池中,根据每个实验的异质成本,选择最有助于最大化高成本目标区域外推准确性的运行序列。其核心是不确定性感知的采集函数,显式建模Scaling Law参数的后验不确定性,并评估每个潜在实验对减少目标区域预测误差的预期价值。
当然,这一方法也存在适用边界。它假设候选实验池和成本估算相对可靠,且目标区域(如计划部署的模型规模与token量)已明确定义。在完全开放的早期探索阶段或成本预估困难的场景下,仍需结合人工判断辅助决策。但在大多数工业级规划流程中,其预算效率优势已足够显著,值得持续跟踪验证。
排名代发飞机【seo1268】好友聊天,输入“最新1元1分红中麻将群”咨询客服,娱乐游戏作为民间很受欢迎的纸牌玩法,乐趣集中在快节奏的刺激感、心理博弈的张力,这两种玩法的规则几乎一学就会,不用记复杂的牌型搭配,就算是新手也能快速上手,梦想是前行的灯塔,哪怕渺小,也能指引方向。不必因梦想遥远就轻言放弃,逐梦的路上,本就布满挑战。拆分目标,步步前行,哪怕每天只前进一小步,也是在靠近理想。不惧旁人的质疑,不畏前路的漫长,坚守初心,全力以赴。只要心中有梦,眼里有光,脚下有路,终能跨越山海,奔赴心之所向的远方。的收尾并非盖棺定论,而是为后续跟进留下空间。变化仍在发生,判断也需随之迭代。