这提醒我们,SEO的核心已转向内容价值的深度构建。
很多开发者在使用OpenHands或Claude Code这类AI Coding Agent修复一个看似简单的bug时,任务跑完后账单却突然暴增,一次普通兼容性调整就能轻松消耗数万甚至上百万token。arXiv近期论文《How Do AI Agents Spend Your Money?
深挖论文数据,核心原因在于代理任务的迭代循环机制。与一次性代码聊天不同,Agentic Coding需要AI反复读取累积上下文、调用工具、观察执行结果、再重新规划下一步。这直接导致输入token被大量消耗——每次循环都必须把历史对话、代码片段、错误日志等重新注入提示词。输出token反而退居次要。论文将此称为“通信税”:代理的“思考”本质上是频繁的内部沟通,而每次沟通都要为不断膨胀的上下文买单。
另一个反直觉发现是准确率与token消耗的关系。高消耗并不必然对应高准确率。数据表明,准确率往往在中间成本区间达到峰值,继续增加token后表现趋于饱和,甚至出现无效浪费。Agent可能陷入冗长循环,重复验证已知路径却无实质进展。这反映出人类对任务难度的主观感知,与Agent实际计算努力之间存在脱节——棘手bug有时只需少量token解决,看似简单问题却因路径随机而耗费巨资。
对行业则意味着可持续商业模式的重构。如果模型预测能力快速提升,固定订阅或有回暖空间,但若 Agent 链路继续复杂化,按 token 或混合模式很可能成为主流。
论文重点剖析了agentic tasks的独特结构。这类任务需要多轮工具调用、代码阅读、补丁生成和测试验证,每一步都会把先前上下文累积进下一轮prompt,导致输入token迅速膨胀。即使启用缓存,上下文管理仍难以完全避免重复开销。输出token虽不可忽视,但整体成本主要由输入驱动。这种“雪球效应”在SWE-bench这类真实仓库级任务中表现尤为明显,简单聊天任务的token规模完全无法与之相比。
arXiv最新论文《How Do AI Agents Spend Your Money?》的轨迹分析显示,这种现象在agentic coding任务中极为普遍,输入token的累积是主因。
arXiv最新论文《How Do AI Agents Spend Your Money?》针对agentic coding任务做了系统分析,考察八个前沿LLM在SWE-bench Verified上的token消耗轨迹。结果显示,agentic任务比普通代码推理或聊天消耗约1000倍token,且主要由输入token主导——Agent在规划、迭代和工具调用中反复读取上下文所致。
最近一篇arXiv论文将AI代理在编码任务中的token消耗模式系统性地摆上台面。研究分析了八个前沿大模型在SWE-bench Verified基准上的完整代理轨迹,首次实证揭示代理任务与普通代码推理或聊天任务之间的巨大差异。行业主流观点仍乐观看待代理对工作流的提升潜力,但论文显示,成本黑箱远比想象中顽固,AI代理看似在替人类省力,实际却在把隐性开支推向前台。
agentic coding的token使用模式呈现出极强的随机性。同一任务在不同运行中,消耗差异可达30倍左右,而高token投入并不必然带来更高准确率——论文数据显示准确率往往在中级成本区间就已接近峰值,继续追加资源反而出现收益递减。模型间效率差距同样显著,某些前沿模型在相同子任务上比基准模型多耗百万级token,即便任务本身难度不高。这种现象说明,开发者凭直觉判断“越强模型越省钱”的认知,可能需要调整。
很多开发者在用AI Agent处理编码任务时,都被云端token账单的突然暴增惊到。arXiv最新论文《How Do AI Agents Spend Your Money?》显示,agentic任务的token消耗比普通代码推理或聊天高出约1000倍,主要由输入token驱动,而非输出。这不是一次性调用,而是Agent在规划、迭代和工具调用中反复读取上下文的结果。月消耗轻松破万甚至更高,让不少团队开始重新审视本地部署的可行性。
别急于对“怎么进一块1分跑的快群”_怎么进一块1分跑的快群iPhone 论坛下定论,不急不躁的真实表现还需要更多观察。
æ¬ææ é¢ï¼AIç¼ç Agentè¿ä»£å¾ªç¯å¦ä½å¯¼è´tokençç¸å¼å¢é¿ï¼é£é©é²æ§
åºå®é¾æ¥ï¼http://www.bbb.cn.ww5.ss7a.cn/6171.html
说æï¼æ¬é¡µå
容以䏻颿´çãä¿¡æ¯è¡¥å
åç¸å
³é
读为主ï¼éåæé¢éç»æåè¿ç»æ¥çã