据动察 Beating 监测,在企业端广泛落地的智能体 AI 正在颠覆专业服务业的单元经济。研究机构 SemiAnalysis 披露,内部大模型 Token 支出已占员工总薪资的 30%,人均月消费近 50 亿个 Token,核心贡献者月消耗更超 1000 亿个。原本需要分析师耗时数小时的 Excel 模型转换与财报图表制作,如今可在几分钟内以数美元的代币成本完成。
实际使用成本的骤降是重塑专业服务业单元经济的关键。虽然 Opus 4.7 官方标价高达每百万 Token 5 美元输入与 25 美元输出,但由于智能体任务高达 300 对 1 的输入输出比,以及 90% 以上的提示词缓存命中率,使得实际混合 Token 成本仅为 0.99 美元/百万。
软件与硬件的共同加速正在进一步压缩生成成本。在 B300 运行 DeepSeek R1 时,通过 wideEP、disagg 与 MTP 软件优化,单 GPU 吞吐量能从 baseline 的 1000 tokens/秒飙升至 14000 tokens/秒,实现 14 倍的纯软件吞吐量提升。而在硬件层面,最优化配置的 GB300 NVL72 吞吐量是 H100 的 17 倍(FP4 下达 32 倍),从而为大模型开发商毛利率的增长提供了结构性保障,并预测 2027 年 Token 价格将远低于当前水平。
币须知道