当前位置：币须知道 > 精选主题 > 时事热门话题 > 正文

跑278亿Token省1万美元，DeepSeekV4凭超高缓存命中实现Token自由

2026-05-11 分类：时事热门话题阅读(50) 评论(0)

据动察 Beating 监测，开发者正在利用 DeepSeek V4 API 极低的缓存命中价格进行大规模全自动编程，其单日处理数百亿 Token 的成本远低于同类模型。尽管 DeepSeek 并未像同行那样推出包月代码套餐（Coding Plan），社交平台上开发者仍评价其真正让普通人实现了 Token 自由，堪称大模型领域的「价格屠夫」。

多位开发者晒出了近期的高频调用账单。一位用户利用 V4 Pro 自动修复 CI 错误，程序连续运行两个半小时并消耗 8000 万 Token，得益于 99.41% 的缓存率，最终仅花费 4 元人民币。另一位开发者单日跑满 278 亿 Token，账单总额仅 160 美元（按官方价格反推，这组极低账单对应的应该是 V4 Flash 模型）。若换成 Claude Sonnet 4.6，即便按同样的缓存命中率估算，成本也约为 11076 美元，两者价差超过 10900 美元。

这种成本落差直接源于 DeepSeek 的极端降价策略。V4 Pro 目前正处于限时 2.5 折优惠期（已延期至 5 月 31 日，输出降至 0.87 美元/百万 Token）；同时全线 API 缓存命中价格均已永久直降十分之一，V4 Pro 实际缓存命中价格低至 0.003625 美元/百万 Token，Flash 版更是只有 0.0028 美元/百万 Token。在反复加载同一代码库前缀的 Agent 编程场景中，缓存命中率往往被拉得极高。在这类极高吞吐量的场景下，纯按量计费的 API 模式反而比限制调用次数的固定包月订阅制更划算。

为了接住这波庞大的智能体开发流量，官方还同步更新了第三方接入指引：在 Claude Code 中将模型名设为 deepseek-v4-pro[1m] 即可解锁百万上下文，OpenCode 和 OpenClaw 也已分别通过升级至 v1.14.24+ 和 v2026.4.24+ 版本完成原生适配。

赞(0)

未经允许不得转载：币须知道 » 跑278亿Token省1万美元，DeepSeekV4凭超高缓存命中实现Token自由

相关推荐

评论抢沙发

回顶部