缓存与计费类问题
重复创建缓存导致单场重复收费
现象:同一场请求过程中出现重复创建缓存,被重复计费。首字时间超过 30 秒可优先怀疑此问题。
原因:备用负载切号后二次转发携带相关请求头,导致请求被误路由并重复创建缓存。
修复步骤:
- 确认现象是否匹配:回看请求链路,确认是否存在同一场请求重复创建缓存以及首字时间明显超过 30 秒
- 取消 ccs 代理,避免请求经过会触发备用负载切号的中间层
- 如需保留转发链路,逐项检查二次转发时透传的请求头,去掉导致误路由的请求头
- 重新发起一场独立请求验证
预防:保持请求链路单一稳定,二次转发时只保留必需请求头。
如何启用 1 小时上下文缓存?
适用于支持长缓存的专用分组,在 ~/.claude/settings.json 的 env 中添加:
json
"ENABLE_PROMPT_CACHING_1H": "1"注意取舍:1 小时缓存的重建成本更高,高频使用场景通常建议保持默认短缓存。只有长链路任务才建议开启。
如何查看当前令牌用量?
在 Claude Code 交互界面输入 /cost 查看当前会话的令牌用量。