首页
学习
活动
专区
圈层
工具
发布

GitHub分享:极致的token压缩!省钱,省钱,还是xx省钱!

这个 GitHub 项目一周涨了 1.4 万星,我一开始以为又是 PPT 开源。

结果看完实测数据,有点离谱:  代码搜索结果从 1.7 万 token 压到 1400,答案几乎没变。

项目叫 Headroom,核心就干一件事:把代码搜索结果、日志、RAG 文档这些长上下文,先压缩一遍,再喂给 AI。

最狠的是它不是简单删内容,而是可逆压缩。原文本地还在,AI 真需要细节时可以再调回来,所以 Debug 能力不会直接被砍废。

几个关键点:  1. Token 最高能砍掉 92% 2. Claude Code / Codex / Cursor 都能 wrap 3. 不用大改代码,可以当代理跑 4. 数据本地处理,不走云端 5. Python 和 Node 都能装 6. 自动在 6 种压缩算法里选  这东西最适合三类人:  用 Claude / Codex 写代码,每月 token 账单肉疼的; 项目上下文太大,AI 动不动丢细节的; 做 RAG、多 Agent、代码搜索,想压成本又不想牺牲效果的。  以前大家优化 AI 编程,都是想办法换模型、换提示词、换工作流。

但真正被忽略的成本,可能是你每次都把一堆“AI 不一定需要完整阅读”的上下文原封不动塞进去。

Headroom 这类工具的价值就在这里:  不是让 AI 更聪明,而是让 AI 少读废话。  免费、本地、开源。  Token 费高的,可以重点看看。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OcsHwE2ATt_TbCnCFuaukG1g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券