据动察 Beating 监测,开发者正在利用 DeepSeek V4 API 极低的缓存命中价格进行大规模全自动编程,其单日处理数百亿 Token 的成本远低于同类模型。尽管 DeepSeek 并未像同行那样推出包月代码套餐(Coding Plan),社交平台上开发者仍评价其真正让普通人实现了 Token 自由,堪称大模型领域的「价格屠夫」。
多位开发者晒出了近期的高频调用账单。一位用户利用 V4 Pro 自动修复 CI 错误,程序连续运行两个半小时并消耗 8000 万 Token,得益于 99.41% 的缓存率,最终仅花费 4 元人民币。另一位开发者单日跑满 278 亿 Token,账单总额仅 160 美元(按官方价格反推,这组极低账单对应的应该是 V4 Flash 模型)。若换成 Claude Sonnet 4.6,即便按同样的缓存命中率估算,成本也约为 11076 美元,两者价差超过 10900 美元。
这种成本落差直接源于 DeepSeek 的极端降价策略。V4 Pro 目前正处于限时 2.5 折优惠期(已延期至 5 月 31 日,输出降至 0.87 美元/百万 Token);同时全线 API 缓存命中价格均已永久直降十分之一,V4 Pro 实际缓存命中价格低至 0.003625 美元/百万 Token,Flash 版更是只有 0.0028 美元/百万 Token。在反复加载同一代码库前缀的 Agent 编程场景中,缓存命中率往往被拉得极高。在这类极高吞吐量的场景下,纯按量计费的 API 模式反而比限制调用次数的固定包月订阅制更划算。
为了接住这波庞大的智能体开发流量,官方还同步更新了第三方接入指引:在 Claude Code 中将模型名设为 deepseek-v4-pro[1m] 即可解锁百万上下文,OpenCode 和 OpenClaw 也已分别通过升级至 v1.14.24+ 和 v2026.4.24+ 版本完成原生适配。
币须知道