首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI SPPECH

    Token Runtime:成本控制与性能优化

    目录 1 引言:为什么Token管理是AI IDE的生命线 2 Token计数:文本到Token的映射与优化 2.1 Tokenization的数学原理 2.2 主流模型的Token计数差异 2.3 Token 计数器的工程实现 2.4 Token计数的精确度优化 2.5 Token计数与成本模型 3 使用量追踪:多维度统计体系设计 3.1 追踪架构设计 3.2 追踪数据模型 4 预算控制:多层次成本约束机制 2 Token计数:文本到Token的映射与优化 本节为你提供的核心技术价值:掌握主流模型的Token计数原理,理解不同编码方式的差异与优化策略 2.1 Tokenization的数学原理 Token是 计数的精确度优化 上述基于统计的估算方法在大多数场景下误差可控制在±10%以内。 Runtime Complete - 完整代码请参见本文各章节实现") 关键词: Token Runtime, AI IDE, 成本控制, 性能优化, 预算管理, 上下文压缩, 缓存策略, 模型选择,

    24710编辑于 2026-05-27
  • 来自专栏养虾记

    优化 OpenClaw Heartbeat,大幅减少 Token 消耗

    完整实战指南:通过架构重构将HeartbeatToken消耗降低95%目录问题背景与痛点分析Heartbeat工作机制深度解析优化策略与架构重构详细实施步骤进阶优化技巧监控与故障排查优化效果量化分析总结与最佳实践一 ────────────────────┐│优化前的Token消耗结构│├──────────────────────────────────────────────────────────────── **如无异常→回复HEARTBEAT_OK**优化效果:字数:500字→50字Token:约800→约100节省:约87.5%4.3第三步:创建Cron任务4.3.1查看现有Cron任务展开代码语言:BashAI 7.1Token消耗对比优化前(每日):项目次数单次Token总计TokenHeartbeat484,000192,000任务执行48包含在心跳中-总计--192,000优化后(每日):项目次数单次Token $1.92$0.26$1.66每月$57.60$7.80$49.80每年$691.20$93.60$597.607.3性能对比指标优化优化后提升心跳响应时间5-10秒1-2秒5x上下文长度5000+Token1800Token64%

    4.1K21编辑于 2026-03-24
  • Claude Code 省钱指南:Token 成本优化实战

    用了ClaudeCode一段时间,发现Token消耗量比你想象的要高?这篇文章帮你系统性地降低Token成本。 1.3缓存计费规则PromptCaching的核心逻辑:展开代码语言:TXTAI代码解释首次请求:完整输入token计费5分钟内再次请求:缓存命中,只计费10%缓存过期(5分钟):重新完整计费省钱关键: 二、零成本优化:用好免费额度2.1识别高消耗场景消耗token的「大户」:场景典型消耗说明读取大文件10-100K+一次请求就消耗大量输入token长对话历史累计增长每轮对话都带上之前的内容反复读取相同文件浪费没有利用缓存输出生成高额输出 &&/cost知道钱花在哪,才能有针对性地优化。 展开代码语言:TXTAI代码解释修改CLAUDE.md→缓存失效→重新完整计费保持不变→缓存命中→只计费10%3.3Skills延迟加载Skills默认在会话开始时加载,消耗上下文。

    1.6K12编辑于 2026-05-24
  • Claude Code 省钱指南:Token 成本优化实战

    一、理解 Token 计费 1.1 输入 Token vs 输出 Token Claude 的计费区分输入和输出: Token 类型 说明 价格相对 输入 Token 发送给 Claude 的内容(你的消息 1.3 缓存计费规则 Prompt Caching 的核心逻辑: 首次请求:完整输入 token 计费 5 分钟内再次请求:缓存命中,只计费 10% 缓存过期(5 分钟):重新完整计费 省钱关键:让「固定的内容 二、零成本优化:用好免费额度 2.1 识别高消耗场景 消耗 token 的「大户」: 场景 典型消耗 说明 读取大文件 10-100K+ 一次请求就消耗大量输入 token 长对话历史 累计增长 每轮对话都带上之前的内容 /context && /cost 知道钱花在哪,才能有针对性地优化。 修改 CLAUDE.md → 缓存失效 → 重新完整计费 保持不变 → 缓存命中 → 只计费 10% 3.3 Skills 延迟加载 Skills 默认在会话开始时加载,消耗上下文。

    23310编辑于 2026-06-15
  • 来自专栏代码简单说

    TRAE如何节省token额度教程(二)Token 节省技巧的10 个实战方法

    TRAE如何节省token额度教程(二)Token 节省技巧的10 个实战方法 关键词:TRAE教程、Token成本优化、AI编程成本、上下文管理、AI Coding 提问技巧、AI IDE 使用技巧 三、10Token 节省实战技巧 技巧1:新开对话,比继续聊更省钱 长对话 = 隐形 Token 黑洞。 技巧4:一次问完,别碎片聊天 碎片对话非常耗费 Token。 错误模式 写组件 再问测试 再问优化 正确模式 一次打包: 创建 Button 组件: 1. 技巧10:任务匹配模型 不要所有任务都用最强模型。 四、TRAE 内置的省 Token 机制 工具本身已经做了很多优化: 智能死循环检测 上下文自动压缩 缓存命中优化 子 Agent 分层任务 模型定向优化 这些都在帮你默默降低成本。

    26010编辑于 2026-06-16
  • 来自专栏从零开始学自动化测试

    python接口自动化10-token登录

    一、登录返回token 1.如下图的这个登录,无cookies ? 2.但是登录成功后有返回token 二、请求头带token 1.登录成功后继续操作其它页面,发现post请求的请求头,都会带token参数 ? 2.这种请求其实比cookie更简单,直接把登录后的token放到头部就行 三、token关联 1.用脚本实现登录,获取token参数,获取后传参到请求头就可以了 2.如果登录有验证码,前面的脚本登录步骤就省略了 ()["token"] # 这是登录后发的一个post请求 post_url = "http://xxx" # 添加token到请求头 header["token"] = token # 如果这个post 传token的方式也有几种,有的传在头部,有的在url里。

    1.9K40发布于 2018-04-08
  • 多模态理解模型的Token消耗优化策略

    摘要: 多模态理解模型按Token消耗量计费,优化Token使用是控制成本的关键。 理解这些规律,是制定Token消耗优化策略的基础。 以分辨率为640×360的图片为例,测试数据显示指令消耗约为982 Token,且在1-10张图片的范围内保持稳定。 这意味着,在图片数量不变的情况下,优化指令长度可以直接降低总Token消耗。 6.3 定期评估优化效果 Token消耗优化是一个持续的过程。 建议定期(如每月)对优化措施的效果进行评估,包括: 平均单次调用的Token消耗量是否下降 不同优化措施的实际降本效果 优化措施是否对理解准确性产生影响 基于定期评估的结果,持续调整和优化Token消耗策略

    11910编辑于 2026-06-18
  • 来自专栏Python与算法之美

    10,模型的优化

    搜索超参数空间以优化超参数需要明确以下方面: 估计器 超参数空间 交叉验证方案 打分函数 搜寻或采样方法(网格搜索法或随机搜索法) 优化模型的常见方法包括 网格搜索法,随机搜索法,模型特定交叉验证, 信息准则优化。 使用网格搜索法或随机搜索法可以对Pipeline进行参数优化,也可以指定多个评估指标。 ? ? 三, 模型特定交叉验证 一些特定的模型,sklearn构建了一些内部含有交叉验证优化机制的估计器。 它们主要是在linear_model模块。 linear_model.LassoLarsIC 采用了信息准则进行优化

    83321发布于 2020-07-17
  • 来自专栏CodeGuide | 程序员编码指南

    QClaw干掉10亿Token,做出2个精致skills!

    但不深度玩,不干它几亿Token,就不能体验到花钱的快乐!好在呀,好在QClaw每天一个登录的账号,赠送4000万Token。换5个微信(还得家里人多),就是2亿Token! 几十亿Token下去后,我的体验是;它能干活,能想一个你的员工一样,控制这台电脑干活。包括,可以按照需求写代码,完成编译、构建、部署,打开浏览器验证功能逻辑,对于错误的编码可以继续完善。 先拿10亿Token,写2个Skills之后再说(先把腿接上)。——把你工作的方式,训练成技能,让AI懂你!接下来,小傅哥就分享下,用OpenClaw(QClaw)做的一些事。 如果有问题,则进行优化功能的处理。不过,做这类东西,还是需要懂场景,懂产品,懂架构,懂技术。否则,它真运行起来,也是会有不少问题的。 只要有Token就想让AI继续搞。软件工程交付,需要的不只是代码,还包括完整的理解代码,代码与产品PRD完全匹配,从而形成代码资产。

    1.6K160编辑于 2026-03-30
  • 来自专栏区块链入门

    叶开:Token设计画布与10大设计模式

    Token经济设计专家叶开,通过多年的企业实践经验总结而出的Token设计画布与10大设计模式,为企业提供最全面的实现参考。 而同时叶开也结合实践总结出了Token经济模式设计画布及10大设计模式。 Token模式、模板化Token模式以及实现Token模式的通用语言。 Token经济的10大设计模式 为了传统企业能够简单便捷的理解TokenToken的设计,叶开提炼了10Token模式,这些模式可以帮助传统企业快速理解Token的变化和组合,并且可以作为模板来分析和套用自己企业相对应的 本文转载自《专访Token经济设计专家叶开:Token设计画布与10大设计模式》,版权属于原作者

    1.1K40发布于 2018-08-10
  • 来自专栏Java知识点

    10章_索引优化与查询优化

    虽然 SQL 查询优化的技术有很多,但是大方向上完全可以分成 物理查询优化 和 逻辑查询优化 两大块。 物理查询优化是通过 索引 和 表连接方式 等技术来进行优化,这里重点需要掌握索引的使用。 关联查询优化 # 3.1 数据准备 # 分类 CREATE TABLE IF NOT EXISTS `type` ( `id` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT ` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT, `card` INT(10) UNSIGNED NOT NULL, PRIMARY KEY (`bookid`) 优化是必须的。 # 9.2 前缀索引对覆盖索引的影响 结论: 使用前缀索引就用不上覆盖索引对查询性能的优化了,这也是你在选择是否使用前缀索引时需要考虑的一个因素。 # 10.

    95730编辑于 2023-08-02
  • 来自专栏大大的小数据

    cluade现在有10token了之二不错2023.6.5

    1、5.15想测试cluade1万token,没有plus无疾而终,今天有plus了 https://mp.weixin.qq.com/s/4VxSI2xlc6bXpAd-L_a08A 2、 3、https 1641889853162995712 垃圾视频 https://www.zhihu.com/question/600571085/answer/3024626500 GPT4 对手 Claude 史诗升级,一次提取十万 token 还行 10、文章认为有哪些AI技术值得关注?为什么? 点get到了 11、分别告诉我第1、2、3、4、5讲课程,都引用了哪些例子,解释了什么内容?

    43820编辑于 2023-09-11
  • 来自专栏机器之心

    微软新出热乎论文:Transformer扩展到10亿token

    机器之心报道 机器之心编辑部 已经扩展到了10亿token,未来能否将整个互联网作为一个序列处理? 在微软最新的一项研究中,他们这次直接将 Transformer 扩展到 10 亿 token。这为建模非常长的序列开辟了新的可能性,例如将整个语料库甚至整个互联网视为一个序列。 然而,这些方法尚未将 Transformer 扩展到 10 亿 token 的规模(参见图 1)。 下表为不同计算方法的计算复杂度比较。N 为序列长度,d 为隐藏维数。 方法 该研究的解决方案 LONGNET 成功地将序列长度扩展到 10 亿个 token。 在实现过程中,LONGNET 可以转化成一个密集 Transformer,以无缝地支持针对 Transformer 的现有优化方法(例如内核融合(kernel fusion)、量化和分布式训练)。

    50220编辑于 2023-08-07
  • 来自专栏GiantPandaCV

    解析 Token to Token Vision Transformer

    最后看下T2T,通过Token to Token结构(下文会讲),它在浅层的时候也能建模出结构信息,同时也避免了极值的出现。 Token To Token结构 ? 这样会逐渐减少token的数量,但随之而来token的长度会增加很多(因为多个tokens连接在一个token),因此后续模型也降低了维度数目,以平衡计算量。 2, 3], [4, 5, 6], [7, 8, 9]], [[10 [ 2., 3., 5., 6.], [ 4., 5., 7., 8.], [ 5., 6., 8., 9.], [10 整体架构 T2T架构如上图所示,先经过2次Tokens to Token操作,最后给token加入用于图像分类的cls token,并给上位置编码(position embedding),送入到Backbone

    8.1K10发布于 2021-03-11
  • 来自专栏新智元

    next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+

    token预测 标准语言模型通过执行一个「下一个token预测」任务来对大型文本语料库进行学习,任务目标是最小化交叉熵损失,其中模型需要最大化「在给定之前token序列历史的条件下,预测下一个token z,然后再把该表征送入到n个独立的头网络,以并行的方式预测每一个未来tokentoken预测的交叉熵损失可以分解为两部分:在给定token序列下的潜表征,以及在该潜表征条件下,预测n个未来token 实验结果显示,使用4个未来token进行训练时,在HumanEval和MBPP的所有pass at 1, 10和100指标上均超越了其他对比模型:MBPP的改进分别为+3.8%, +2.1%和+3.2% 微调多token预测器 在机器学习领域,预训练模型通过多token预测损失函数进行训练,相较于传统的单token预测模型,该方法在后续的微调阶段展现出了更好的性能。 在自然语言上的多token预测 研究人员训练了参数量为7B的模型,并使用了三种不同的预测损失方法:预测4token、2-token以及单个token,并在6个标准的自然语言处理(NLP)基准测试中进行了性能评估

    87810编辑于 2024-06-05
  • 来自专栏机器之心

    神奇token提升10倍记忆?

    例如,LlaMA-70B 在知识数据集上的表现比 LlaMA-7B 好 30%,这并不能说明模型扩大 10 倍仅仅能在容量上提高 30%。 最引人注目的结果来自于作者的定律 10-12(见图 4)。 作者提出了一个简单但极其有效的策略,只需给所有的 (预) 训练数据加上自己的网站域名 token 即可。例如,将 Wiki 百科数据统统加上 wikipedia.org。 作者提出了一个简单的实验来验证:如果高质量数据都加上一个特殊 token(任何特殊 token 都行,模型不需要提前知道是哪个 token),那么模型的知识存储量可以立即回升 10 倍,是不是很神奇? 所以说对预训练数据增加域名 token,是一个极其重要的数据制备操作。

    42310编辑于 2024-04-12
  • 来自专栏测试开发真货

    从零搭建一个django项目-10-token校验

    01 — auth类 创建一个auth校验类,从请求参数或者请求头中获取token值,继承的BaseAuthentication类返回的第一个参数会赋值给request.user。 = request.query_params.get('token') payload = parse_payload(token) if not payload['status ,即headers = {'auth-token': '1234'} # 应该使用request.META.get("HTTP_AUTH_TOKEN") # 获取 我们加上token请求看看,我们刚刚加的校验是判断请求头里面的,使用我们我需要加到请求头里: token从哪来呢,我们需要先调下登录接口获取(注意获取请求头时候要加上HTTP_并且转成大写,-改成下划线 03 — 预告 一会要整理照片,所以先更到这,下一节在页面请求加入token请求并判断返回状态。

    83320编辑于 2022-06-13
  • 来自专栏call_me_R

    10个JS优化小技巧

    .markdown-body h4,.markdown-body h5,.markdown-body h6{line-height:1.5;margin-top:35px;margin-bottom:10px #f8f8f8}.markdown-body blockquote:after{display:block;content:""}.markdown-body blockquote>p{margin:10px let test: boolean; if (x > 100) { test = true; } else { test = false; } // 简洁 let test = x > 10 冗余 let test = ''; for(let i = 0; i < 5; i ++) { test += 'test '; } // 简洁 'test '.repeat(5); 10

    76230发布于 2021-02-05
  • 来自专栏glm的全栈学习之路

    2021-10-10-Acwing1087(单调队列优化dp)

    content/1089/ 思路见下图: 代码: #include<iostream> using namespace std; #define int long long const int N=1e5+10

    36310发布于 2021-10-13
  • 来自专栏cjz的专栏

    Windows10 关闭传递优化

    传递优化是什么? 你一定有一个疑问,那就是没有网络的时候,也会提示更新系统,因为传递优化就是在局域网里,其它的wind版本比你的高,就回自动去拉去下载,最后让你更新 关闭传递优化步骤 按 wini+i调出设置 进入更新与安全 或者直接搜索: 传递优化

    1.3K30编辑于 2022-12-21
领券