据动察 Beating 监测,聚合服务商 OpenRouter 披露,开源模型与闭源前沿模型的性能差距已稳定在 3 至 6 个月。在过去 18 个月中,前沿闭源实验室未能如预期般拉开身位,而以中美新玩家为代表的开源力量正凭借极高的性价比加速平替闭源模型。
DeepSeek V4 Flash 发布仅两个月就成为平替首选。拥有 2840 亿参数的 DeepSeek V4 Flash 在 SWE-bench Verified 评测中取得 79.0% 的成绩,表现逼近 GPT-5.5 级别。官方第一方输入/输出定价仅为 0.14/0.28 美元/百万 token,输出成本比 GPT-5.5 便宜约 150 倍。即使加上不保留数据训练的西方云托管溢价,实际成本也仅在闭源前沿模型的 1.3% 左右。
除了价格优势,智谱 2026 年 6 月发布的 GLM 5.2 在 Artificial Analysis 开源权重智能指数中排名第一,并在真实智能体评测中比肩 GPT-5.5 级别,成为长程编程规划的替换方案。不过,GLM 5.2 在深度思考时较为消耗 token,企业部署时需平衡输出成本。多模态开源模型 MiniMax M3 则凭借创新的 MSA 稀疏注意力架构,以较低的代币价格提供了原生图像与视频的长上下文处理能力,成为 Gemini Flash 的强劲开源对手。
同时,基于 Mamba-2 混合架构的英伟达 Nemotron 3 Ultra 成为最强的美国本土开源力量,旨在通过开放生态拉动英伟达硬件与微服务生态的市场需求。
OpenRouter 强调,虽然前沿闭源模型最终仍会向前推进,但固定智能水平的代币成本将持续走低,为企业提供了重大的成本优化空间。
币须知道