首页
学习
活动
专区
圈层
工具
发布

#token

给 AI Agent 装一个文件系统——字节 OpenViking 如何用三层摘要省掉 90% token

用户7411420

字节跳动火山引擎推出的「AI Agent 上下文数据库」,用文件系统范式(viking:// 协议)统一管理 Agent 的记忆、资源和技能,L0/L1/L2 ...

600

35000 token 压缩到 920——claude-mem 如何用渐进式披露解决 AI 的记忆问题

用户7411420

Claude Code 生态中最成熟的持久记忆插件,通过「Observer Agent + 渐进式上下文披露」架构,让 AI 在会话间保持项目知识连续性,6.5...

800

做 AI 应用开发,模型 API 选哪家好?

用户7013336

2026 年了,国产大模型卷了两年多,每家都说自己最强。Benchmark 分数一个比一个高,但真正拉到生产环境里跑,体验天差地别。本文不聊跑分,从实际应用开发...

2000

TokenHub:面向Agent时代的企业级Token生产与调度平台

IT资讯研究所

腾讯科技 | 研究员 (已认证)

TokenHub是腾讯云推出的企业级大模型MaaS平台,定位为面向Agent时代的Token生产与调度系统,具备全模型覆盖严选、极致成本优化、Agent级容量保...

8210

TokenHub:企业级Token生产与调度平台的技术优势与应用实践

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

一、 产品定位与核心亮点 TokenHub是腾讯云推出的面向Agent时代的企业级Token生产与调度平台。其核心技术属性为一站式模型服务接入与调度平台,商业差...

3210

零成本调用Qwen3.6无限Token,保姆级教程

苏三说技术

不知道有多少小伙伴在工作中遇到过这种场景:开发AI Agent应用写到一半,调试了无数次终于调通,结果一算token消耗,钱包先扛不住了。

16810

多模型切换时如何保持 API 调用格式一致?

用户7013336

做 AI 应用开发最头疼的事之一:项目里从 DeepSeek 切到通义千问,整个调用链路都得重写。参数名不一样、返回格式不一样、流式 SSE 结构也不一样。有没...

3000

# AI Coding Agent Token成本优化指南(上):成本结构、使用习惯与模型路由

深蓝studyzy

真正的成本大头藏在别的地方。这篇文章,就是把这个"别的地方"讲清楚,然后给一套不用装任何工具、今天就能用的省钱方法。

8610

AI Coding Agent Token 成本优化指南(下):工具层、代码图谱与多 Agent 协作

深蓝studyzy

如果你把上篇的行动清单做完了,成本通常已经有明显下降。但如果你想继续往下压,就要开始处理系统层的问题:命令输出怎么压、检索怎么少走弯路、多个 Agent 怎么把...

9610

“Token经济”进入结果层

小腾资讯君

Fin把“解决”叫作“outcome”。简而言之,这件事,我替你做,直到这个需求被处理完,也可以必要时可以转人工、上下文没丢,才算数。它不按对话条数收,也不管你...

13310

这 3 个开源小工具,帮你让 Coding Agent 少吃点 Token

七牛开发者

有了 Tokalator,你就可以直观地看到这些原本并不可见的消耗:当前上下文用了多少、预算还剩多少、哪些内容可能正在拖累上下文效率。它就像是一个“token ...

19210

硅谷 AI 词元天价账单:终结免费午餐时代,成本管控成新命题

用户12539106

2026 年,硅谷 AI 产业正经历一场深刻的成本觉醒。曾被视为 “免费燃料” 的词元(Token),近期接连爆出天价账单,宣告 AI 行业 “免费午餐” 时代...

5710

当Agent开始“吃”Token,AI时代需要怎样的“运输线”?

Alter聊科技

从早期一问一答的对话,到自主执行、深度协同的Agent,AI正全面进入人类的生活和生产系统。

9110

一篇讲透 Agent:Token、Skill、RAG、MCP、SDD、Harness

java金融

上周有个朋友拿着一个 Agent 项目来问我。 他做的是代码变更助手:用户提一句“给订单模块加一个优惠券核销能力”,Agent 自动读代码、查接口文档、改代码、...

14110

ollama v0.30.2 正式发布:自动安装 Cline CLI、Radeon 核显兼容、缓存 Token 统计、llama.cpp 升级完整实测文档

福大大架构师每日一题

Ollama v0.30.2于2026年6月3日正式上线,本次版本累计提交15次代码变更,修改38个代码文件,包含安全漏洞修复、llama.cpp内核版本升级、...

47720
领券