事实	推论
代码中无任何 caching 调用	不可能产生显式缓存费用
累计充值仅 ¥1050（约 $150）	不具备 Tier5 资格，无法使用显式 Context Caching
隐式缓存设计是降本机制	不应产生独立的高额计费项
账单却显示 ¥929 Context Caching 费用	这是平台计费 bug

2.3 Moonshot 官方确认

申诉后 Moonshot 客服确认为平台 bug，全额退回 ¥1000 至账户余额。

三、申诉过程与成功要点

3.1 关键证据链

申诉成功的核心是构建无可辩驳的事实证据：

代码证据：证明从未调用任何 caching 相关接口

资格证据：累计充值未达 Tier5，无权使用显式 Context Caching

比例证据：缓存费占比 98.6%，与模型推理费比例严重失衡

官方文档证据：隐式缓存按官方说明应是降本机制

3.2 有效话术结构

避免"求情式"申诉，采用"事实陈述式"申诉：

3.3 申诉教训

✅ 基于事实：引用官方文档条款，而非情感诉求

✅ 数据说话：用比例、数字证明异常

✅ 态度专业：求"协助核查"而非"要求退款"，给对方台阶

✅ 保留证据：截图、代码、文档全部归档

四、防御方案（四层架构）

4.1 防御体系总览

重要程度：第一层 >>> 其他。即使其他防线失效，¥30/天的硬上限仍能兜底。

4.2 第一层：平台用量限制

在 Kimi 控制台 → 组织管理 → 用量限制设置：

设置项	推荐值	说明
每日消费上限	¥30	正常使用绝对达不到，触发=出问题
每月消费上限	¥200	月度兜底
余额预警	¥100	低于此值发通知
自动充值	❌ 关闭	防止 bug 期间自动续费

4.3 第二层：API Key 速率限制

针对小型应用 + kimi-k2 + 防代码 bug 场景：

限制项	推荐值	理由
TPM	60,000	单次大请求够用，循环失控会被卡
RPM	60	平均每秒 1 次，少量并发够用
TPD	2,000,000	日 token 上限约 ¥40-80
RPD	2,000	防整夜失控

4.4 第三层：监控脚本

详见 /opt/kimi-monitor/ 部署，监控原理见第五节。

4.5 第四层：代码层防御

五、监控脚本部署

5.1 监控原理

由于 Kimi 公开 API 没有提供消费明细查询接口，采用间接监控法：

5.2 三级告警阈值

级别	触发条件	颜色	动作
注意	5 分钟下降 > ¥5	🟡	Telegram 通知
警告	5 分钟下降 > ¥20	🟠	Telegram 通知 + 详情
紧急	5 分钟下降 > ¥50	🔴	立即通知 + 建议禁用 Key
余额低	余额 < ¥10	🟡	Telegram 提醒

5.3 文件结构

5.4 部署步骤

5.5 配置文件模板

5.6 接入 Uptime Kuma（推荐）

防止监控脚本自身故障的"监控的监控"：

Uptime Kuma 创建 Push 类型监控，超时设为 10 分钟

在 kimi-monitor.sh 主逻辑结尾添加：

脚本超过 10 分钟无 push，Uptime Kuma 会告警

六、应急响应流程

6.1 收到 Telegram 告警时

🟡 注意级别（5分钟下降 ¥5-20）

🟠 警告级别（5分钟下降 ¥20-50）

🔴 紧急级别（5分钟下降 > ¥50）

6.2 余额低告警

6.3 监控脚本失效告警（Uptime Kuma）

七、关键文档与链接

7.1 Kimi 官方文档

平台首页：https://platform.moonshot.cn/

API 文档：https://platform.moonshot.cn/docs/

余额查询接口：https://platform.moonshot.cn/docs/api/balance

速率限制：https://platform.moonshot.cn/docs/pricing/limits

Context Caching 介绍：https://platform.moonshot.cn/blog/posts/context-caching

定价说明：https://platform.moonshot.cn/docs/pricing/chat

7.2 申诉渠道

控制台工单：右上角"联系销售"

邮件：sales@moonshot.cn

12315 投诉（终极手段）

7.3 监控相关

Telegram Bot API：https://core.telegram.org/bots/api

MarkdownV2 转义规则：https://core.telegram.org/bots/api#markdownv2-style

八、经验总结

8.1 核心教训

金额硬上限是终极防线：技术防御都可能失败，平台金额上限不会

隐式机制最危险：用户无感知开启的功能，一旦计费 bug 就是巨坑

公开账单的不对称性：用户只能看汇总，平台知道明细

申诉要靠事实，不靠情感：基于官方文档条款的矛盾点最有力

所有 LLM 平台的"用量限制"都要假设是软限制，除非官方明确承诺实时熔断

8.2 通用 LLM API 安全清单

不只适用于 Kimi，所有付费 LLM API 都建议：

设置每日/每月消费上限

关闭自动充值

使用独立 API Key（业务/测试/监控分离）

配置速率限制（TPM/RPM/RPD）

部署余额监控脚本

接入告警通道（Telegram/邮件等）

应用代码加超时和异常处理

不主动启用未充分理解的"省钱"功能（如各种 caching）

保留申诉证据（代码、日志、截图）

定期检查账单异常项

8.3 防御深度（Defense in Depth）思想

九、变更记录

日期	变更	备注
2026-05-03	异常事件发生	当日消费 ¥942
2026-05-04~05	申诉与协商	平台确认 bug
2026-05-06	退款到账 ¥1000 + 制定防御方案	-
2026-05-06	文档创建	本笔记

常见204测速URL

群晖NAS第三方软件库

Last update: 2026-05-06

欢迎大家🎉

基于NotionNext搭建的新Wiki已经上线😉