首页/rtk-ai/rtk — CLI 代理将 LLM Token 消耗降低 60-90%,开发命令必备(50.9k ⭐,今日 +704)

rtk-ai/rtk — CLI 代理将 LLM Token 消耗降低 60-90%,开发命令必备(50.9k ⭐,今日 +704)

0 次浏览
2026/5/20

rtk-ai/rtk — CLI 代理将 LLM Token 消耗降低 60-90%

GitHub: https://github.com/rtk-ai/rtk Stars: 50,925 ⭐(今日 +704 🔥) 定位: 通过智能 CLI 代理层大幅降低 LLM Token 消耗

核心问题

使用 Claude Code、Cursor 等 AI 编程工具时,大量 Token 被浪费在:

  • 重复读取未变化的文件内容
  • 传递冗余的工具调用结果
  • 不必要的上下文重传
  • 低效的文件搜索和遍历

rtk 作为一个透明的 CLI 代理层,在这些操作到达 LLM 之前进行智能压缩和去重。

工作原理

传统流程:
Claude Code → 读取文件A(2000 token)→ LLM
           → 再次读取文件A(2000 token)→ LLM  ← 浪费!
           → 搜索结果(500 token)→ LLM

rtk 优化后:
Claude Code → rtk → 读取文件A(2000 token)→ 缓存
           → 再次读取文件A → rtk 返回缓存(0 token)← 节省!
           → 搜索结果 → rtk 压缩(150 token)→ LLM

四大优化技术

1. 智能文件缓存(File Content Caching)

  • 基于文件内容哈希的精确缓存
  • 文件未变化时直接返回缓存,不消耗 Token
  • 变更检测粒度到行级别

2. 工具结果压缩(Tool Output Compression)

  • 搜索结果去重和摘要化
  • 长文件内容的智能截断(保留关键部分)
  • 结构化数据的紧凑表示

3. 上下文去重(Context Deduplication)

  • 检测并移除重复传递的信息
  • 对话历史的智能压缩
  • 保持语义完整性的前提下最小化 Token

4. 预取优化(Prefetch Optimization)

  • 预测 Agent 下一步可能需要的文件
  • 提前缓存,减少等待延迟
  • 基于代码依赖关系的智能预取

实测节省效果

任务类型原始 Tokenrtk 后节省比例
大型重构45,00012,00073%
Bug 修复8,0002,40070%
功能开发22,0008,80060%
代码审查15,0004,50070%

快速安装

npm install -g @rtk-ai/rtk
rtk init  # 自动配置为 Claude Code 代理
# 无需修改任何现有配置,透明代理

适合场景

  • 重度 Claude Code / Cursor 用户
  • 团队使用 AI 工具,需要控制 API 成本
  • 大型代码库的 AI 辅助开发
  • 需要精确追踪 Token 消耗的场景

免责声明

本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

  • 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
  • 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
  • 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
  • 因不当使用引发的版权或合规风险,由使用者自行承担。
  • 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。

转载或引用本文内容,请保留原文链接并注明来源。

评论

加载中...