据 动察 Beating 监测,在模型聚合平台 OpenRouter 公布的大模型调用量排行榜中,中国大模型呈现出历史性的「霸榜」态势。其中,4 月 24 日发布的 DeepSeek V4 Flash,在上线仅一个月的首秀中便以 7.99T(万亿)tokens 的调用量直接登上月度排行榜第一。
根据 OpenRouter 最新的 LLM 调用量月度榜单,前十名排位如下:
1. DeepSeek V4 Flash:7.99T tokens
2. Hy3 preview (腾讯混元 3.0 预览版):7T tokens
3. Claude Sonnet 4.6:6.65T tokens
4. Claude Opus 4.7:6.07T tokens
5. Hy3 preview (free):5.83T tokens
6. Kimi K2.6:5.45T tokens
7. Gemini 3 Flash Preview:4.57T tokens
8. DeepSeek V3.2:4.06T tokens
9. DeepSeek V4 Pro:3.4T tokens
10. MiniMax M2.7:2.95T tokens
除 DeepSeek 独占三席(V4 Flash、V3.2、V4 Pro)外,腾讯混元(Hy3 预览版与免费版共计 12.83T tokens)、月之暗面(Kimi K2.6)、MiniMax(M2.7)表现同样强劲。西方主流模型中仅剩 Anthropic 与 Google 守住三个席位,在总量与声势上均显被动。
这一流量版图的剧变,核心得益于中国大模型在「极致性价比」与「长文本处理」上的双重突破。以 DeepSeek V4 Flash 为代表的轻量级 MoE 架构,完美切合了 Cursor、Claude Code 等自主编程智能体在高频、大上下文读取时的刚性降本需求,成为全球开发者在智能体(Agent)场景下的默认首选。
币须知道