Guides

计费与预算

余额、quota、用量、项目预算和账单排查的说明。

概述

UOUODUO Gateway 按模型、输入 token、输出 token 和供应商计费规则计算费用。

最终费用以控制台日志和用量页展示为准。

本文档先说明计费概念,具体充值通道和汇率会在部署前补齐。

费用从哪里来

一次调用的费用通常由以下因素决定:

  • 模型单价
  • 输入 token 数
  • 输出 token 数
  • 是否使用图片、音频或其他模态
  • 是否命中缓存或特殊计费策略
  • 当前路由到的上游供应商

模型目录会展示公开价格。

实际调用仍应以日志里的最终 cost 为准。

quota 说明

系统内部可能使用 quota 做余额单位。

生产文档里会在 N1 计费闭合后补上明确换算关系。

当前占位说明:

1 USD = X quota

在换算值确定前,不要把 quota 数字直接展示给最终用户作为美元金额。

查看余额

进入 `/app/credits` 查看账户余额和奖励记录。

进入账单页查看充值、扣费和账户统计。

如果团队启用了项目预算,项目页也会显示项目维度的消耗状态。

截图待补

查看用量

进入 `/app/usage`。

常见用量维度:

  • 按日期
  • 按模型
  • 按 endpoint
  • 按 API key
  • 按项目

建议生产服务至少每天检查一次异常峰值。

日志里的费用

`/app/logs` 会展示单次请求费用。

排查账单时,先按时间范围过滤日志,再对比 Usage 页面聚合值。

如果存在流式断连,请以服务端记录的最终 token 和费用为准。

项目预算

项目预算适合团队和多应用场景。

进入 `/app/projects` 创建项目后,可以配置预算和密钥绑定。

预算触顶后,相关密钥可能无法继续调用。

建议给每个生产服务单独创建项目和密钥,便于追踪成本。

密钥命名建议

推荐命名:

  • `prod-web`
  • `prod-worker`
  • `staging-api`
  • `local-dev-<name>`

不要多个服务共用同一个密钥。

密钥粒度越清晰,账单排查越快。

充值通道

充值通道会在支付方案确定后补齐。

目前文档保留占位:

充值通道待补。

上线前需要补充支付方式、到账时间、发票或收据说明。

退款与申诉

退款和费用申诉流程会按正式服务条款补齐。

建议用户提交以下信息:

  • 账户邮箱
  • 时间范围
  • request ID 或项目 ID
  • 认为异常的费用金额
  • 复现方式或业务背景

没有 request ID 时,也可以提供模型、时间和 API key 名称。

成本控制建议

生产环境建议:

  • 使用较小模型处理分类、抽取和预处理
  • 为长输出设置 `max_tokens`
  • 对聊天历史做摘要
  • 给测试环境设置单独预算
  • 为批量任务设置并发和速率限制

成本优化应先看 Usage 页面里的模型分布,再决定是否换模型。

异常排查

如果费用异常增长:

  1. 打开 `/app/usage` 定位日期和模型。
  2. 打开 `/app/logs` 过滤对应模型。
  3. 检查是否有异常长输入或长输出。
  4. 检查是否有循环重试。
  5. 临时撤销可疑 API key。

撤销密钥后,相关服务会立刻无法继续调用,请提前评估影响。