速率限制与费用
理解和管理 API 使用对于顺畅且经济高效地使用 itBuilder 至关重要。本节解释如何追踪你的 token 使用和费用。速率限制默认设为 0(禁用),通常无需调整,现在可在每个配置文件中单独设置;如需设置,详见 API 配置文件 文档。
Token 使用
itBuilder 与 AI 模型交互时使用 token。token 本质上是单词的片段。一次请求和响应中使用的 token 数量会影响处理时间和费用。
- 输入 Token: 包含在你的提示词中的 token,包括系统提示、你的指令和任何提供的上下文(如文件内容)。
- 输出 Token: AI 模型在响应中生成的 token。
你可以在聊天历史中看到每次交互所用的输入和输出 token 数量。
费用计算
大多数 AI 提供商按 token 数量计费。具体价格取决于提供商和所用模型。
itBuilder 会根据所配置模型的价格自动估算每次 API 请求的费用。该费用会显示在聊天历史中,紧邻 token 使用量。
注意:
- 费用计算为估算值。实际费用可能因提供商计费方式略有差异。
- 部分提供商可能有免费额度或赠送积分。详情请查阅各自文档。
- 有些提供商支持提示缓存,可大幅降低费用。
限制自动批准请求次数
为进一步帮助管理 API 费用并防止意外支出,itBuilder 提供了“最大请求数”设置,用于自动批准操作。你可以为自动批准的任务设置连续 API 调用的上限。
- 工作原理: 如果你设置了限制(如 5 次),itBuilder 会自动批准最多 5 次 API 调用。在第 6 次调用前,它会暂停并提示你“重置并继续”,如下图所示。
达到自动批准请求上限时的通知。
- 配置方法: 该限制可在“自动批准操作”设置中配置。你可以设置具体次数或选择“无限制”。详细配置步骤见 自动批准操作文档。
设置自动批准操作的“最大请求数”。
此功能为复杂或长时间运行的任务提供了额外保障,防止多次 API 调用导致意外费用。
优化 Token 使用的小贴士
- 简明扼要: 在提示词中使用清晰简练的语言,避免冗余。
- 只提供相关上下文: 有选择地使用上下文引用(
@file.ts
、@folder/
)。只包含与任务直接相关的文件。 - 拆分任务: 将大型任务分解为更小、更聚焦的子任务。
- 使用自定义指令: 通过自定义指令引导 itBuilder 行为,减少每次提示词中的冗长说明。
- 选择合适的模型: 某些模型性价比更高。对于不需要强大能力的任务,可考虑使用更小、更快的模型。
- 使用模式: 不同模式可访问不同工具,例如
Architect
模式无法修改代码,适合分析复杂代码库且无需担心误操作导致高额费用。 - 如未使用 MCP 可禁用: 若你未用到 MCP(模型上下文协议)功能,建议在 MCP 设置中禁用,可显著减少系统提示大小并节省 token。
通过理解和管理 API 使用,你可以高效且经济地使用 itBuilder。