首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏养虾记

    优化 OpenClaw Heartbeat,大幅减少 Token 消耗

    ────────────────────┐│优化前的Token消耗结构│├──────────────────────────────────────────────────────────────── 报告数据清理脚本:展开代码语言:BashAI代码解释python3/Users/mac/.openclaw/workspace/scripts/skill_analyzer.pycleanup这个脚本会:删除7天前的原始数据压缩历史报告更新索引文件报告位置原始数据 **如无异常→回复HEARTBEAT_OK**优化效果:字数:500字→50字Token:约800→约100节省:约87.5%4.3第三步:创建Cron任务4.3.1查看现有Cron任务展开代码语言:BashAI 7.1Token消耗对比优化前(每日):项目次数单次Token总计TokenHeartbeat484,000192,000任务执行48包含在心跳中-总计--192,000优化后(每日):项目次数单次Token $1.92$0.26$1.66每月$57.60$7.80$49.80每年$691.20$93.60$597.607.3性能对比指标优化优化后提升心跳响应时间5-10秒1-2秒5x上下文长度5000+Token1800Token64%

    4.1K21编辑于 2026-03-24
  • 来自专栏AI SPPECH

    Token Runtime:成本控制与性能优化

    目录 1 引言:为什么Token管理是AI IDE的生命线 2 Token计数:文本到Token的映射与优化 2.1 Tokenization的数学原理 2.2 主流模型的Token计数差异 2.3 Token 计数器的工程实现 2.4 Token计数的精确度优化 2.5 Token计数与成本模型 3 使用量追踪:多维度统计体系设计 3.1 追踪架构设计 3.2 追踪数据模型 4 预算控制:多层次成本约束机制 2 Token计数:文本到Token的映射与优化 本节为你提供的核心技术价值:掌握主流模型的Token计数原理,理解不同编码方式的差异与优化策略 2.1 Tokenization的数学原理 Token是 线程安全:支持高并发场景 9.3 未来演进方向 智能化增强 基于强化学习的自适应压缩策略 更精准的任务复杂度预测 用户习惯学习与个性化路由 多模态扩展 图像Token的计量与优化 音视频内容的上下文管理 Runtime Complete - 完整代码请参见本文各章节实现") 关键词: Token Runtime, AI IDE, 成本控制, 性能优化, 预算管理, 上下文压缩, 缓存策略, 模型选择,

    24410编辑于 2026-05-27
  • Claude Code 省钱指南:Token 成本优化实战

    用了 Claude Code 一段时间,发现 Token 消耗量比你想象的要高?这篇文章帮你系统性地降低 Token 成本。 一、理解 Token 计费 1.1 输入 Token vs 输出 Token Claude 的计费区分输入和输出: Token 类型 说明 价格相对 输入 Token 发送给 Claude 的内容(你的消息 二、零成本优化:用好免费额度 2.1 识别高消耗场景 消耗 token 的「大户」: 场景 典型消耗 说明 读取大文件 10-100K+ 一次请求就消耗大量输入 token 长对话历史 累计增长 每轮对话都带上之前的内容 /context && /cost 知道钱花在哪,才能有针对性地优化。 3.2 CLAUDE.md 优化 CLAUDE.md 是缓存的「黄金地段」——每次请求都会带上,且位置靠前。

    23010编辑于 2026-06-15
  • Claude Code 省钱指南:Token 成本优化实战

    用了ClaudeCode一段时间,发现Token消耗量比你想象的要高?这篇文章帮你系统性地降低Token成本。 一、理解Token计费1.1输入Tokenvs输出TokenClaude的计费区分输入和输出:Token类型说明价格相对输入Token发送给Claude的内容(你的消息+文件+系统提示)较低输出TokenClaude 二、零成本优化:用好免费额度2.1识别高消耗场景消耗token的「大户」:场景典型消耗说明读取大文件10-100K+一次请求就消耗大量输入token长对话历史累计增长每轮对话都带上之前的内容反复读取相同文件浪费没有利用缓存输出生成高额输出 &&/cost知道钱花在哪,才能有针对性地优化。 3.2CLAUDE.md优化CLAUDE.md是缓存的「黄金地段」——每次请求都会带上,且位置靠前。

    1.6K12编辑于 2026-05-24
  • 来自专栏苏三说技术

    微服务Token鉴权的7种方案

    前言 最近有球友问我:微服务中Token鉴权除了使用JWT之外,还有什么其他的方案? 今天这篇文章跟大家一起聊聊微服务Token鉴权的7种方案,希望对会有所帮助。 1. 为什么必须做Token鉴权? :必须使用PKCE扩展防止授权码截持攻击 方案3:Sa-Token轻量级框架 该方案是的国产Token鉴权方案的精品。 } return chain.filter(exchange); }); } } 性能优化技巧 " + token); } 安全加固:使用JWT嵌套加密防止内部Token泄露 方案6:JWE加密令牌 该方案能保证金融级安全。 ())); return jwe.serialize(); } 适用场景: 支付凭证 身份证号传输 医疗健康数据 方案7:双向TLS认证 该方案是零信任架构。

    80420编辑于 2025-08-06
  • 来自专栏Java帮帮-微信公众号-技术文章全总结

    Tomcat7优化

    用了很久的Tomcat,没怎么看过它的优化,今天抽出时间研究了下,将内容记录下。 示的参数来优化tomcat。    二、优化 1. 禁用AJP协议   (1)通过禁用AJP协议,达到在集群的时候提高处理请求的时间。 将BIO通讯模式修改为NIO通讯模式   (1)tomcat通讯协议支持http1.0和1.1,tomcat默认走的是BIO通讯模式,tomcat7和tomcat8之所以默认的都是效率低下的BIO通讯模式 优化连接器   最佳实践:   5.

    2.2K100发布于 2018-03-15
  • 多模态理解模型的Token消耗优化策略

    摘要: 多模态理解模型按Token消耗量计费,优化Token使用是控制成本的关键。 理解这些规律,是制定Token消耗优化策略的基础。 6.3 定期评估优化效果 Token消耗优化是一个持续的过程。 建议定期(如每月)对优化措施的效果进行评估,包括: 平均单次调用的Token消耗量是否下降 不同优化措施的实际降本效果 优化措施是否对理解准确性产生影响 基于定期评估的结果,持续调整和优化Token消耗策略 七、成本与效果的平衡 7.1 避免过度优化 Token消耗优化需要在成本和效果之间取得平衡。过度追求Token消耗的降低,可能会对理解准确性产生负面影响,反而导致业务质量的下降。

    11910编辑于 2026-06-18
  • 来自专栏ClearSeve

    Windows7 系统优化

    Diagostic policy server 检测网络 禁用 print Spooler 打印机 禁用 Superfetch 加速了固态硬盘的寿命损耗禁用, 机械键盘自动 Windows Defender 禁用 Windows Update 禁用 Windows Search 文件索引

    3.4K50编辑于 2022-02-11
  • 来自专栏GiantPandaCV

    解析 Token to Token Vision Transformer

    as np np_input = np.array([[[[1, 2, 3], [4, 5, 6], [7, unfolded) # 输出为 tensor([[[ 1., 2., 4., 5.], [ 2., 3., 5., 6.], [ 4., 5., 7. ') self.soft_split0 = nn.Unfold(kernel_size=(7, 7), stride=(4, 4), padding=(2, 2)) (dim=in_chans * 7 * 7, in_dim=token_dim, num_heads=1, mlp_ratio=1.0) self.attention2 = Token_transformer transpose(1, 2) # final tokens x = self.project(x) return x 首先设置三个划窗大小分别为7x7

    8.1K10发布于 2021-03-11
  • 来自专栏mathor

    枚举+优化7)——前缀和1

    思路2 前缀和优化优化的思路就是先把部分和,转换成前缀和的差。 的倍数: Ans = 0 For i = 1...N For j = i...N If (S[j] - S[i - 1]) % k == 0 Ans++  优化之后的复杂度是 //把答案累加上C(cnt[i], 2) //也就是cnt[i]*(cnt[i]-1)/2 cout << ans; return 0; }  上面的程序既用到了前缀和优化

    78270发布于 2018-06-19
  • 来自专栏博文视点Broadview

    PHP 7 CSS与JavaScript优化

    本文我们将讨论两种针对CSS、JavaScript文件的优化手段——合并和缩小。本文选自《高性能PHP 7》。 性能在Web应用程序中起着至关重要的作用,甚至谷歌也很在意其查询性能。 最好能优化、压缩和缓存一切。 合并 在合并过程中,我们可以将所有CSS文件合并为一个文件,并且使用同样的方法对JavaScript文件进行合并,从而为CSS和JavaScript创建一个单独的文件。 grunt cssmin 之后,通过下面这行命令优化JavaScript文件。

    3.8K20发布于 2020-06-11
  • 来自专栏运维经验分享

    CentOS 7 运维优化

    CentOS 7 运维优化 一般的,我们安装CentOS mini和其他相应服务后,就能正常工作了。但工作一段时间后,服务器会出现不稳定、被入侵、甚至在突然的高并发时直接瘫痪状况。 所以,在这里提供一些运维优化的建议。 1.关闭不需要的服务 众所周知,服务越少,系统占用的资源就会越少, 所以应当关闭不需要的服务。 1 2 3 4 5 10.修改SSH登录配置 SSH服务配置优化,请保持机器中至少包含一个具有sudo权限的用户,下面的配置禁止root远程登录,代码内容如下所示: # 禁止root远程登录 sed 12.优化Linux下的内核TCP参数以提高系统性能 内核的优化跟服务器的优化一样,应本着稳定安全的原则。 如果以上优化仍无法满足工作要求,则又可能需要定制你的服务器内核或升级服务器硬件。 (adsbygoogle = window.adsbygoogle || []).push({});

    2.9K20发布于 2019-03-11
  • 来自专栏测试开发干货

    【简历优化平台开发教程-7

    先来看看上面的设计,我们已经完成了 业务方向和工龄的选择。本节课,要来完成工作性质的选择。

    32341编辑于 2023-08-14
  • 来自专栏释然IT杂谈

    【实用】CentOS 7系统优化脚本

    一键优化 2. 自定义优化 3. 安装常用工具及修改yum源 7. 优化系统内核 8. 加快ssh登录速度 9. -eq 0 ];then wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 完成安装常用工具及修改yum源" /bin/true echo "===========================================================" sleep 2 } #7. ;; 6) yumset ;; 7)

    1.8K10编辑于 2022-10-27
  • 来自专栏后端精进之路

    JVM性能优化系列-(7) 深入了解性能优化

    7. 深入了解性能优化 7.1 影响系统性能的方方面面 影响系统性能的因素有很多,以下列举了常见的一些系统性能优化的方向: 7.2 常用的性能评价和测试指标 响应时间 提交请求和返回该请求的响应之间使用的时间 7.3 常用的性能优化手段 对于系统的性能调优,总体上从如下三个方面入手: 前端优化 应用服务性能优化 存储性能优化 但是无论怎么优化,总原则就是: 避免过早优化优化的前提是基本功能完成且测试通过; 进行系统性能测试,需要通过性能测试来确定性能,不能主观臆测; 寻找系统瓶颈,分而治之,逐步优化。 前端优化 浏览器/App 减少请求数; 使用客户端缓冲; 启用压缩 资源文件加载顺序 减少Cookie传输 CDN加速 反向代理缓存 WEB组件分离 应用服务性能优化 1.

    34910编辑于 2023-10-19
  • 来自专栏亦枫的大佬之路

    前端性能优化(21种优化+7种定位方式)

    就值得注意了,重点优化一下。 然后进行优化。以减少我们的bundle包size,减少加载时长。 先记住如何获取到这些指标,后面来一一进行解析优化。 : 前端的优化种类繁多,主要包含三个方面的优化:网络优化(对加载时所消耗的网络资源优化),代码优化(资源加载完后,脚本解释执行的速度),框架优化(选择性能较好的框架,比如benchmark)。 合理实用web worker可以优化复杂计算任务。这里直接抛阮一峰的入门文章:传送门 3.16 缓存 缓存的原理就是更快读写的存储介质+减少IO+减少CPU计算=性能优化

    13.5K76发布于 2020-10-28
  • 来自专栏全栈程序员必看

    小米 token(token在哪里获取)

    小米设备token获取&HomeAssistant安装部署 小米智能设备token获取 miIO-discovery获取token与控制 app直接token获取 DB获取token 开源智能家居平台HomeAssistant 在使用这个局域网控制协议之前需要获取到设备token,接下来介绍小米设备获取token的一些方法。 :’,tok) 运行python3.5 miio_test.py,获取小米Wi-Fi插座token 执行控制脚本,输入插座的ip和token两个参数就可以看到现在插座的状态,在这两个参数的基础上添加 接下来还有一种方法可以直接从app获取token。以小米绿米网关为例,首先下载米家app,将绿米网关配置入网后,点击网关设备。接下来步骤如下组图,最后的密码即为网关的token。 目前绿米的这种设计模式是最方便用户的,而且设备的所有者还可以选择是否开放局域网控制以及刷新控制token的有效性,个人还是很希望小米的其他设备同样开放app侧获取设备token,因为毕竟获取需要搭建复杂的环境以及调试代码

    10.7K10编辑于 2022-07-29
  • 来自专栏GiantPandaCV

    原理&图解vLLM Automatic Prefix Cache(RadixAttention)首Token时延优化

    这三个技术目前在TensorRT-LLM、vLLM这两个常用的LLM推理框架中都已经支持,因此,从应用落地的角度来说,理解这三个优化技术的原理也比较有意义。 token的耗时。 Only Prefix KV Caching (2)Prefix + Generated KV Caching的优化,多轮对话分析。 Baburaj||\n|F E B|20|7|Srishti|Chowalloor Krishnankutty, Ravi Alummoodu|K. T. Muhammad|M. S. Prefix Caching的优化思路,并非只有SGLang RadixAttention以及vLLM中的实现。

    15K32编辑于 2024-06-04
  • 来自专栏云攻略专区

    Openlaw 网关 Token 激增与成本超标问题及优化研究方向

    Tokens 消耗指数级增长Tokens 资源供应严重不足模型调用费用持续超标二、研究方向(4 大核心)上游多种模型轮询调度技术多模型负载均衡、故障转移、优先级路由按任务复杂度自动分配大 / 小模型,降低整体 Token 消耗提升服务可用性,避免单点瓶颈模型 Prompt 提示词限制与 Token 节省技术精简指令、结构化提示、冗余信息剔除上下文压缩、历史对话摘要、长度硬限制优雅截断与缓存复用,在不降低效果前提下大幅省 Token中间件与 CodingPlan 共享消耗池技术构建 Token 共享消耗池,统一配额与限流中间件统一鉴权、计费、监控、熔断CodingPlan 任务编排与复用,减少重复调用与浪费本地化基础模型私有轻量化部署小 AI 多模型、AI 音视频数字人硬件智能方案多模型协同推理、音视频实时生成优化、数字人硬件加速方案、端云协同智能架构,提升表现力与运行效率。

    35810编辑于 2026-03-16
  • 来自专栏全栈程序员必看

    token身份认证机制(token怎么获取)

    这个token 我不保存,当小F把这个token 给我发过来的时候,我再用同样的HMAC-SHA256 算法和同样的密钥,对数据再计算一次签名, 和token 中的签名做个比较, 如果相同, 我就知道小 客户端储存 token, 并且每次请求都会附带它。 服务端验证 token 并返回数据。 每一次请求都需要TokenToken 应该在 HTTP的头部发送从而保证了 Http 请求无状态。 校验成功则返回请求数据,校验失败则返回错误码 当我们在程序中认证了信息并取得 token 之后,我们便能通过这个 token 做许多的事情。 使用 token 完美解决了此问题。 (2)安全性 请求中发送 token 而不是 cookie,这能够防止 CSRF(跨站请求伪造) 攻击。 我们也不一定需要等到token自动失效,token有撤回的操作,通过 token revocataion可以使一个特定的 token 或是一组有相同认证的 token 无效。

    7.3K10编辑于 2022-07-29
领券