
如果你经常用ChatGPT API或者其他大模型,月底账单可能让你心疼。现在有个开源项目叫"caveman-compression",能帮你省下不少钱。
原理很直接:把废话删掉,关键信息留着。
举个例子:
原文:为了优化数据库查询性能,我们应该考虑在经常访问的列上实现索引...
压缩:需要快速查询。检查哪些列用得最多。给这些列加索引...同样的意思,token少了29%。费用直接打7折。

这个方法基于一个关键发现:大模型本身就擅长填补语言空白,能自动补全缺失的语法和连接词。
会被删掉的(机器能补全的):
会被保留的(机器猜不到的):
举个实际例子:
压缩前:"Company medium-large. Location Stockholm."
机器理解:"at a medium-large company based in Stockholm"机器自动加上了语法,但事实信息一点没变。
方式一:调用OpenAI压缩
方式二:本地NLP压缩
作者测试了几种常见场景:
如果你每月API费用1000块,用了这工具可能直接降到600块。
特别适合:
别用在:
如果要最大压缩率:
git clone https://github.com/wilpel/caveman-compression
pip install -r requirements.txt
# 配置你的OpenAI API key
python caveman_compress.py compress "你的文本"如果要免费使用:
pip install -r requirements-nlp.txt
python -m spacy download zh_core_web_sm # 中文支持
python caveman_compress_nlp.py compress "你的文本"作者做了测试,压缩前后的关键信息100%保留。而且大模型本来就擅长理解这种"电报体"文字。
不过说实话,压缩后的文字确实像原始人说话。但对机器来说没问题,核心意思都在。
这种思路其实挺实用的。特别是那些需要处理大量文档、频繁调用API的开发者。比如做RAG系统的,把知识库压缩一遍,查询效率能提升不少。
还有做AI Agent的,让Agent内部推理用这种格式,同样的上下文窗口能塞进更多思考步骤。
如果你的API账单让你肉疼,这个工具值得一试。MIT开源协议,代码透明,风险不大。
最坏情况就是压缩效果不理想,但至少能让你对token优化有些新思路。毕竟在AI越来越贵的今天,能省一点是一点。
项目地址:https://github.com/wilpel/caveman-compression