企业如何管控AI词元使用成本

随着 AI 智能体应用愈发普及,企业在 AI 词元上的支出将持续攀升,不少企业开始借鉴云计算时代的成本管控手段节流 不少企业技术管理者开始复用云计算发展时期打磨成熟的各类成本管控方案。 内容速览 员工大范围使用 AI、各类高级 AI 智能体落地,使得企业正面临人工智能成本快速飙升的难题。 企业向来擅长在支出失控时及时踩下刹车,但人工智能正在考验这种成本管控能...

随着 AI 智能体应用愈发普及,企业在 AI 词元上的支出将持续攀升,不少企业开始借鉴云计算时代的成本管控手段节流 不少企业技术管理者开始复用云计算发展时期打磨成熟的各类成本管控方案。 内容速览 员工大范围使用 AI、各类高级 AI 智能体落地,使得企业正面临人工智能成本快速飙升的难题。 企业向来擅长在支出失控时及时踩下刹车,但人工智能正在考验这种成本管控能力。AI 相关成本持续走高,不过绝大多数技术负责人依旧相信,这项技术最终能够为企业创造实实在在的回报,只是不能不计成本盲目投入。 多位首席信息官在接受领导力研究院采访时表示,他们正在落地多项成本管控策略,其中就包括云计算兴起阶段、企业为应对云成本暴涨所摸索出的成熟管控方案,以此将 AI 支出控制在合理区间。 在线旅游公司普林斯琳 IT 财务高级总监克里斯・里德表示:“使用 AI 相当于把信用卡交到了终端用户手中。如果缺乏管控机制、用户也没有接受成本相关培训,企业的账单数额就会一路飙升。” 和以往几轮技术浪潮不同,本次企业 AI 普及面向全体员工,并非仅限研发人员使用。AI 大多按照调用量计费,作为 AI 算力基础计量单位的词元,其定价波动频繁,多重因素叠加直接推高了企业的 AI 使用成本。 里德介绍,普林斯琳通过可视化仪表盘实时追踪词元消耗量,每月会向首席财务官、首席技术官提交使用报告。一旦某员工词元用量异常偏高,企业会与其沟通 AI 使用场景;如果该员工正在推进可产生营收的项目,相关用量限额可适度放宽。 从指令式聊天机器人,到全天候自主运行的 AI 智能体,行业应用的迭代进一步加大了成本压力,后者的词元消耗量要高出数倍。随着更大规模、更复杂的大模型不断落地,相关成本预计还将大幅上涨。 百时美施贵宝首席数字与技术官格雷格・迈尔斯表示:“未来的 AI 支出规模将比现在高出好几个数量级。” 他还提到,随着 AI 应用来到行业拐点,各类 AI 智能体带来的成本将呈指数级增长。 迈尔斯称,他已经向公司管理层、首席财务官以及董事会提前沟通,让各方做好词元消耗大幅攀升的预期。 但并非全是坏消息,他表示:“结合我们预判的商业收益来看,AI 项目的投资回报率整体会十分可观。” 词元消耗规模预测(单位:千万亿词元) 企业级智能体、消费级智能体、非智能体类 AI 算力任务 2025—2030 年消耗量持续走高 复用云时代的成本管控工具 不少企业技术负责人开始沿用云计算浪潮中沉淀下来的成本治理经验。 美国信安金融集团首席信息官凯西・凯表示,这家金融服务企业正在复刻云时代的治理与优化机制,在规模化落地 AI 的同时管控成本。比如根据业务场景匹配适配的大模型,避免出现 “调用量越高、成本必然越高” 的情况。 “当前模型定价、技术能力迭代速度很快,我们在方案设计阶段就预留灵活调整空间,方便后续持续优化 AI 部署效率。” 凯补充道。 云财务运营(FinOps)模式 2010 年代云计算大规模普及后,FinOps(融合财务、工程、产品多维度的云财务运营体系)应运而生,用于管控技术与云资源支出、最大化技术投入的商业价值。 智能表格平台 Smartsheet 首席信息官兼首席信息安全官拉维・索因介绍,公司专门由 FinOps 团队统一追踪整体 AI 开支。“必须明确预算的责任归属方。” 该软件企业设置了用量自动预警机制,员工词元额度即将触顶时会收到系统提醒。 “公司全员可按照部门、直属管理者维度查看用户用量仪表盘,实时掌握调用频次与花费,避免月底收到账单时才发现成本严重超支。” 他说道。 还有不少企业开始招聘具备 FinOps 从业经验的外部专家。根据招聘信息,美国西维斯健康正在招募 AI 运维工程执行董事,岗位要求精通 FinOps,涵盖 GPU 成本治理、降本增效等工作内容。 AI 智能体遍地开花,成本压力陡增 当前企业 AI 使用规模创下历史新高,大量上线的 AI 智能体甚至让企业难以全面统计管控。 高盛高级股票研究分析师吉姆・施耐德表示,和向聊天机器人提问相比,指令智能体完成一项任务所需的算力高达前者的 50 倍。高盛预测,未来四年 AI 智能体将让行业词元总消耗量提升 24 倍,到 2040 年,商用 AI 智能体的词元消耗将暴涨至当前的 55 倍。 OpenAI、Anthropic 两大模型厂商均表示词元单价正在下调,两家企业也曾考虑过大幅降价。 即便词元单价走低,智能体因需要跨多个智能体协同、长时间不间断运行,整体消耗量依旧大幅上涨。贝恩公司调研数据显示:2024 年 12 月至 2025 年 12 月,主流模型单价降幅约 50%,但同期行业词元总调用量暴涨 4.5 倍。 削减 AI 账单的各类实操方案 技术管理者表示,企业面临的难题不仅是管控 AI 花费,还要衡量技术投入对应的商业价值。 高通首席信息官阿提拉・蒂尼奇介绍,这家半导体企业采用多重手段管控 AI 成本,包括为不同团队设置词元使用上限。“各类研发团队无疑是词元消耗大户。” 高通还在企业内部推行成本公示机制(Showback):向各业务部门同步其 AI 词元对应的实际花费,让各团队清晰了解自身资源消耗带来的成本影响。 OpenText 首席信息官兼首席数字官香农・贝尔表示,成本公示或更进一步的内部费用分摊机制(Chargeback),可帮助企业将词元相关开支降低 20% 至 30%。“我们需要让各研发负责人对自身的资源投入、业务产出全权负责。” 不过 AI 使用场景错综复杂,很难通过单一方式精准量化价值。 普林斯琳的里德谈到:“AI 调用量高低本身没有绝对好坏,核心要看对应的业务成果,而这也是最难量化的部分。” 这种价值不确定性,促使企业采用另一类降本思路:按业务场景优化单任务使用成本。不再所有任务都依托高成本的超大模型,而是按需选用轻量化模型、老旧成熟模型或是开源大模型。蒂尼奇补充,基于高通自研硬件部署轻量化模型,还能进一步压缩开支。 劳氏零售首席数字与信息官西曼蒂妮・戈博尔表示,企业已经出台规范与管控机制避免词元浪费,优先选用轻量化、开源大模型。 “只要服务于业务目标,合理的词元消耗就具备价值。我们必须杜绝不必要的资本投入。”

查看原文