单纯的技术调整已不够,必须结合行业现象提供有价值的观察和归纳。
主流声音仍充满乐观。OpenAI首席科学家Jakub Pachocki等业界人士反复强调AI是经济转型技术,Anthropic的报告预测大量管理、建筑和媒体岗位将被重塑,而初期试用反馈多集中在效率提升上。不少企业和职场人表示,AI辅助文档处理或代码生成后,产出速度明显加快。但这些表层乐观,往往忽略了真实部署后的经济可行性,宣传中实验室表现轻易被等同于商业价值。
最近MIT Technology Review的一篇报道直指AI发展的尴尬现实:模型技术已基本就位,经济转型的愿景也反复被描绘,但从试点到真正盈利的中间环节,却普遍卡壳。许多组织不是缺少更先进的AI算法,而是缺少能让这些算法在生产环境中稳定运行并产生回报的底层支撑。这件事比表面看起来复杂得多——AI盈利往往不是模型再迭代一点就能解决,而是基础设施先要完成从传统到现代化的转变。
主流媒体和AI厂商过去几年把几乎所有注意力都放在模型能力提升上。OpenAI等机构的科学家反复强调AI是潜在的经济转型技术,似乎只要模型够强大,利润就会顺理成章地到来。企业高层受此影响,大量资源投入到训练和试点项目中。然而现实反馈却相当刺耳:大量AI试点热闹启动,一旦进入大规模生产环境就迅速失速,成本居高不下却难见明显回报。主流讨论中,基础设施现代化这个关键盲区被严重低估,导致AI难以真正嵌入现有工作流。
短期内,这一缺失将继续让企业面临高投入低回报的困境,大量AI项目因无法证明清晰ROI而流产或缩减,决策智能的规模化落地率维持在较低水平。长期看,若不补上决策痕迹与优化闭环,AI大概率停留在工具辅助层,而难以真正进入决策核心,企业软件栈从记录系统向决策系统的范式转移也将受阻。数据支持这个方向,但样本量和真实世界评估仍有限,值得持续跟踪,现在下结论为时尚早。
当前企业AI热潮表面上看一片繁荣。采购ChatGPT Enterprise、各类代理工具成了战略标配,内部甚至设立使用率排行榜,奖励频繁调用AI的员工。OpenAI科学家将生成式AI称为“经济变革技术”,主流观点普遍认为AI将彻底转型业务流程,大家仿佛已看到最终的盈利图景。但现实中,大量讨论仅停留在技术采集和宏大愿景上,很少触及落地过程中的真实障碍。这件事远比hype复杂,企业若继续忽略中间环节,投入的资源很可能化为沉没成本。
缺失的Phase 2远非简单上线模型,而是需要系统性的流程重构、人类与AI的协作分工、真实场景下的持续评估与迭代。内裤侏儒的笑话之所以流传,正因为它精准捕捉了“只管堆积不管如何转化”的荒诞。只采购工具却缺乏清晰执行路径,AI再强也只是昂贵的摆设。早期不少AI投资项目最终令人失望,往往源于数据质量不足或系统集成困难,而非模型本身能力问题。
深层来看,这正是典型的“AI people problem”。AI需要企业敢于撕掉部分旧流程,把它真正内化为业务运作的一部分,而非当作附加的自动化插件。领导力缺失在这里表现得尤为明显:制定宏大AI战略容易,面对组织阻力、利益调整和文化冲突时却常常退缩。结果就是大量“表演式AI”——试点热闹非凡,实际产出寥寥。数据支持这个方向,但样本量和执行细节仍需持续观察,值得行业长期跟踪。
当然,补齐执行计划并非一蹴而就,行业内对落地路径仍有不同声音。一些企业已开始从小场景试点入手,明确人类与AI的分工边界,建立迭代反馈机制。但如果大多数公司仍只强调模型升级而忽视流程适配,从收集到利润的路径就可能长期模糊。Mercor的测试结果也提醒我们,即使顶级代理在专业任务上仍有明显提升空间,前提仍是企业愿意投入精力桥接技术和业务现实。
引入TCO模型、NPV计算以及试点实测等价值证明工具,能实现持续跟踪而非一次性评估。先在小范围部门上线3-6个月,收集真实前后数据,再决定规模化路径。中小企业库存预测AI项目就是一个可复制的案例:痛点诊断显示手动预测导致年度额外成本约80万元,项目定义准确率提升至85%以上、周转率提高15%后,三个月试点便实现预测准确率87%、周转天数从45天降至38天,节省损失约45万元,首年ROI达到120%,回本周期不到半年。
短期内,这一执行挑战会让更多企业继续徘徊在“试点炼狱”。预算审核趋严,内部支持声音减弱,投资回报滞后现象普遍。长期来看,竞争格局将明显分化:那些能有效填补缺失步骤的企业,不仅能将AI转化为实实在在的成本优势或营收增长,还可能重塑业务模式;而持续停留在表面hype的企业,则面临被市场逐步甩开的风险。当然,模型透明度和真实世界评估方法的进步存在不确定性,若能加快,则落地进程或将提速,否则冷却期可能延长。
我的判断是——但这个判断可能需要后续数据修正——想玩一块1分跑的快群的爆发窗口正在悄然临近。