据动察 Beating 监测,Claude Developer Console 上线 Prompt Caching Dashboard,入口在 platform.claude.com/usage/cache。
仪表盘按工作区、模型和时间段筛选,主要展示三项数据:缓存读取率(cache read ratio),即请求中命中已有缓存的比例;缓存用量构成,把输入 token 拆成未缓存、5 分钟缓存写入、1 小时缓存写入和缓存读取四类,以堆叠条形图呈现;写入摊销倍数(write amortization),衡量一次缓存写入被后续读取复用了多少次。截图示例中 Claude Opus 4.6 在 7 天内处理了 27.4 亿输入 token,读取率 85.4%,写入摊销 8.65 倍。底部还有按 1 小时到 24 小时粒度的缓存读取率时序图。
Anthropic 的提示缓存机制允许 API 用户把系统提示、长上下文等固定内容标记为可缓存,首次写入收取额外费用,后续命中则按标准输入价的约一折计费。缓存默认保留 5 分钟,付费可延至 1 小时。此前用户只能从 API 返回的 token 计数字段间接判断缓存效果,没有可视化工具。
币须知道