rtk-ai/rtk — CLI 代理将 LLM Token 消耗降低 60-90%，开发命令必备（50.9k ⭐，今日 +704）

rtk-ai/rtk — CLI 代理将 LLM Token 消耗降低 60-90%

GitHub: https://github.com/rtk-ai/rtk Stars: 50,925 ⭐（今日 +704 🔥）定位: 通过智能 CLI 代理层大幅降低 LLM Token 消耗

核心问题

使用 Claude Code、Cursor 等 AI 编程工具时，大量 Token 被浪费在：

重复读取未变化的文件内容
传递冗余的工具调用结果
不必要的上下文重传
低效的文件搜索和遍历

rtk 作为一个透明的 CLI 代理层，在这些操作到达 LLM 之前进行智能压缩和去重。

工作原理

传统流程：
Claude Code → 读取文件A（2000 token）→ LLM
           → 再次读取文件A（2000 token）→ LLM  ← 浪费！
           → 搜索结果（500 token）→ LLM

rtk 优化后：
Claude Code → rtk → 读取文件A（2000 token）→ 缓存
           → 再次读取文件A → rtk 返回缓存（0 token）← 节省！
           → 搜索结果 → rtk 压缩（150 token）→ LLM

四大优化技术

1. 智能文件缓存（File Content Caching）

基于文件内容哈希的精确缓存
文件未变化时直接返回缓存，不消耗 Token
变更检测粒度到行级别

2. 工具结果压缩（Tool Output Compression）

搜索结果去重和摘要化
长文件内容的智能截断（保留关键部分）
结构化数据的紧凑表示

3. 上下文去重（Context Deduplication）

检测并移除重复传递的信息
对话历史的智能压缩
保持语义完整性的前提下最小化 Token

4. 预取优化（Prefetch Optimization）

预测 Agent 下一步可能需要的文件
提前缓存，减少等待延迟
基于代码依赖关系的智能预取

实测节省效果

任务类型	原始 Token	rtk 后	节省比例
大型重构	45,000	12,000	73%
Bug 修复	8,000	2,400	70%
功能开发	22,000	8,800	60%
代码审查	15,000	4,500	70%

快速安装

npm install -g @rtk-ai/rtk
rtk init  # 自动配置为 Claude Code 代理
# 无需修改任何现有配置，透明代理

适合场景

重度 Claude Code / Cursor 用户
团队使用 AI 工具，需要控制 API 成本
大型代码库的 AI 辅助开发
需要精确追踪 Token 消耗的场景