Guides
计费与预算
余额、quota、用量、项目预算和账单排查的说明。
概述
UOUODUO Gateway 按模型、输入 token、输出 token 和供应商计费规则计算费用。
最终费用以控制台日志和用量页展示为准。
本文档先说明计费概念,具体充值通道和汇率会在部署前补齐。
费用从哪里来
一次调用的费用通常由以下因素决定:
- 模型单价
- 输入 token 数
- 输出 token 数
- 是否使用图片、音频或其他模态
- 是否命中缓存或特殊计费策略
- 当前路由到的上游供应商
模型目录会展示公开价格。
实际调用仍应以日志里的最终 cost 为准。
quota 说明
系统内部可能使用 quota 做余额单位。
生产文档里会在 N1 计费闭合后补上明确换算关系。
当前占位说明:
1 USD = X quota在换算值确定前,不要把 quota 数字直接展示给最终用户作为美元金额。
查看余额
进入 `/app/credits` 查看账户余额和奖励记录。
进入账单页查看充值、扣费和账户统计。
如果团队启用了项目预算,项目页也会显示项目维度的消耗状态。
截图待补
查看用量
进入 `/app/usage`。
常见用量维度:
- 按日期
- 按模型
- 按 endpoint
- 按 API key
- 按项目
建议生产服务至少每天检查一次异常峰值。
日志里的费用
`/app/logs` 会展示单次请求费用。
排查账单时,先按时间范围过滤日志,再对比 Usage 页面聚合值。
如果存在流式断连,请以服务端记录的最终 token 和费用为准。
项目预算
项目预算适合团队和多应用场景。
进入 `/app/projects` 创建项目后,可以配置预算和密钥绑定。
预算触顶后,相关密钥可能无法继续调用。
建议给每个生产服务单独创建项目和密钥,便于追踪成本。
密钥命名建议
推荐命名:
- `prod-web`
- `prod-worker`
- `staging-api`
- `local-dev-<name>`
不要多个服务共用同一个密钥。
密钥粒度越清晰,账单排查越快。
充值通道
充值通道会在支付方案确定后补齐。
目前文档保留占位:
充值通道待补。
上线前需要补充支付方式、到账时间、发票或收据说明。
退款与申诉
退款和费用申诉流程会按正式服务条款补齐。
建议用户提交以下信息:
- 账户邮箱
- 时间范围
- request ID 或项目 ID
- 认为异常的费用金额
- 复现方式或业务背景
没有 request ID 时,也可以提供模型、时间和 API key 名称。
成本控制建议
生产环境建议:
- 使用较小模型处理分类、抽取和预处理
- 为长输出设置 `max_tokens`
- 对聊天历史做摘要
- 给测试环境设置单独预算
- 为批量任务设置并发和速率限制
成本优化应先看 Usage 页面里的模型分布,再决定是否换模型。
异常排查
如果费用异常增长:
- 打开 `/app/usage` 定位日期和模型。
- 打开 `/app/logs` 过滤对应模型。
- 检查是否有异常长输入或长输出。
- 检查是否有循环重试。
- 临时撤销可疑 API key。
撤销密钥后,相关服务会立刻无法继续调用,请提前评估影响。