首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏私人订制

    thinkphp6 token令牌 生成详解

    生成Token(createToken) <? ($token=null){ //检测是否接收到了token if(empty($token)){ return 0; } //转化为可以验证的token $token = (new Parser())->parse((string) $token); //验证基本设置 $data //清空token 将需清空的token存入缓存,再次使用时,会读取缓存进行判断 $token = \Token::getRequestToken(); $delete_token : []; $delete_token[] = $token; cache('delete_token', $delete_token, 86400); $this->ok();

    1.7K10编辑于 2023-05-11
  • 来自专栏AI SPPECH

    Token Runtime:成本控制与性能优化

    目录 1 引言:为什么Token管理是AI IDE的生命线 2 Token计数:文本到Token的映射与优化 2.1 Tokenization的数学原理 2.2 主流模型的Token计数差异 2.3 Token 计数器的工程实现 2.4 Token计数的精确度优化 2.5 Token计数与成本模型 3 使用量追踪:多维度统计体系设计 3.1 追踪架构设计 3.2 追踪数据模型 4 预算控制:多层次成本约束机制 2 Token计数:文本到Token的映射与优化 本节为你提供的核心技术价值:掌握主流模型的Token计数原理,理解不同编码方式的差异与优化策略 2.1 Tokenization的数学原理 Token是 消耗: {result.token_count.total_tokens}") print(f" 成本: ${result.cost.total_cost:.6f}") Runtime Complete - 完整代码请参见本文各章节实现") 关键词: Token Runtime, AI IDE, 成本控制, 性能优化, 预算管理, 上下文压缩, 缓存策略, 模型选择,

    24910编辑于 2026-05-27
  • 来自专栏养虾记

    优化 OpenClaw Heartbeat,大幅减少 Token 消耗

    ────────────────────┐│优化前的Token消耗结构│├──────────────────────────────────────────────────────────────── **如无异常→回复HEARTBEAT_OK**优化效果:字数:500字→50字Token:约800→约100节省:约87.5%4.3第三步:创建Cron任务4.3.1查看现有Cron任务展开代码语言:BashAI **"\--message"检查所有Cron任务状态,如有失败任务请通知"\--sessionisolated七、优化效果量化分析7.1Token消耗对比优化前(每日):项目次数单次Token总计TokenHeartbeat484,000192,000 任务执行48包含在心跳中-总计--192,000优化后(每日):项目次数单次Token总计TokenHeartbeat482009,600数据收集2450012,000分析报告41,0004,000数据清理 $93.60$597.607.3性能对比指标优化优化后提升心跳响应时间5-10秒1-2秒5x上下文长度5000+Token1800Token64%并发能力受限提升显著八、总结与最佳实践8.1核心要点职责分离

    4.1K21编辑于 2026-03-24
  • Claude Code 省钱指南:Token 成本优化实战

    用了ClaudeCode一段时间,发现Token消耗量比你想象的要高?这篇文章帮你系统性地降低Token成本。 一、理解Token计费1.1输入Tokenvs输出TokenClaude的计费区分输入和输出:Token类型说明价格相对输入Token发送给Claude的内容(你的消息+文件+系统提示)较低输出TokenClaude 二、零成本优化:用好免费额度2.1识别高消耗场景消耗token的「大户」:场景典型消耗说明读取大文件10-100K+一次请求就消耗大量输入token长对话历史累计增长每轮对话都带上之前的内容反复读取相同文件浪费没有利用缓存输出生成高额输出 &&/cost知道钱花在哪,才能有针对性地优化。 3.2CLAUDE.md优化CLAUDE.md是缓存的「黄金地段」——每次请求都会带上,且位置靠前。

    1.6K12编辑于 2026-05-24
  • Claude Code 省钱指南:Token 成本优化实战

    用了 Claude Code 一段时间,发现 Token 消耗量比你想象的要高?这篇文章帮你系统性地降低 Token 成本。 一、理解 Token 计费 1.1 输入 Token vs 输出 Token Claude 的计费区分输入和输出: Token 类型 说明 价格相对 输入 Token 发送给 Claude 的内容(你的消息 二、零成本优化:用好免费额度 2.1 识别高消耗场景 消耗 token 的「大户」: 场景 典型消耗 说明 读取大文件 10-100K+ 一次请求就消耗大量输入 token 长对话历史 累计增长 每轮对话都带上之前的内容 /context && /cost 知道钱花在哪,才能有针对性地优化。 3.2 CLAUDE.md 优化 CLAUDE.md 是缓存的「黄金地段」——每次请求都会带上,且位置靠前。

    23410编辑于 2026-06-15
  • 来自专栏mathor

    枚举+优化6)——双指针优化2

    ans ans = s } } } print ans  这个算法的时间复杂度是O(NML),NML是三个数组的长度,最大值都是10万,显然会超时 优化 ); } cout << ans; return 0; } 例4.题目链接:hihoCoder1607 思路  一般的暴力枚举这题肯定是过不了的,数据量太大,那我们就要想办法优化

    66550发布于 2018-06-19
  • 多模态理解模型的Token消耗优化策略

    摘要: 多模态理解模型按Token消耗量计费,优化Token使用是控制成本的关键。 token消耗 其中: 指令token即对应的prompt部分,不同长度prompt消耗不一样 图片数向上取偶:例如3张图片按4张计算,5张图片按6张计算 2.2 不同分辨率对应的单图Token消耗 VITA 这意味着: 1张或2张图片,按2张计算Token消耗 3张或4张图片,按4张计算Token消耗 5张或6张图片,按6张计算Token消耗 这种计算规则下,如果一次请求中恰好传入奇数张图片,会多计算一张图片的 6.3 定期评估优化效果 Token消耗优化是一个持续的过程。 建议定期(如每月)对优化措施的效果进行评估,包括: 平均单次调用的Token消耗量是否下降 不同优化措施的实际降本效果 优化措施是否对理解准确性产生影响 基于定期评估的结果,持续调整和优化Token消耗策略

    11910编辑于 2026-06-18
  • 来自专栏后端精进之路

    JVM性能优化系列-(6) 晚期编译优化

    6. 晚期编译优化 晚期编译优化主要是在运行时做的一些优化手段。 “逃生门”,让编译器根据概率选择一些大多数时候都能提升运行速度的优化手段,当激进优化的假设不成立时,可以通过逆优化退回到解释状态继续执行。 从而抵消了额外的编译时间开销. 6.4 编译优化技术 在即时编译器中采用的优化技术有很多,本节主要针对以下四种优化技术: 语言无关的经典优化技术之一:公共子表达式消除 语言相关的经典优化技术之一:数组范围检查消除 最重要的优化技术之一:方法内联 最前沿的优化技术之一:逃逸分析 公共子表达式消除 公共子表达式消除是一个普遍应用与各种编译器的经典优化技术,它的含义是: 如果一个表达式E已经计算过了,并且从先前的计算到现在 ,它与类型继承关系分析一样,并不是直接优化代码的手段,而是为其他优化手段提供依据的分析技术。

    58210编辑于 2023-10-19
  • 来自专栏iSharkFly

    Confluence 6 性能优化

    新的版本通常有更好的性能优化。 因没有足够内存避免 swapping 总是关注你服务器的交换(swapping)活动。 我们推荐你使用你熟悉的数据库,因为你能够更好的对数据库进行维护,这个可能相对你不熟悉的数据库来说,能更好的让你对数据库的性能进行优化。 数据库状态和查询分析 现代的数据库会基于你对数据库运行的查询历史来对查询进行优化。使用 SQL EXPLAIN 语句将会告诉你数据库查询的优化情况。 如果数据库查询命中率明显的不同,那么你需要考虑对数据库运行状态收集和优化。针对你数据库的版本不同,优化的版本和方向也会不同。 https://www.cwiki.us/display/CONF6ZH/Performance+Tuning

    1.5K40发布于 2019-01-30
  • 来自专栏每天晒白牙

    IPv6定位优化

    背景 随着 IPv6的推进,我们发现线上需要使用 IPv6 定位的流量已经达到了 8000 QPS。 此前我们并未对 IPv6 定位做任何缓存或者其它优化,这部分流量会直接请求定位服务,随着流量进一步提升可能触发调用量报警以及流控。 另外由于此前已经对 IPv4 进行了缓存,如果 IPv6 不做相应的优化,因为多了一次 RPC 请求,服务的响应时间会随着 IPv6 流量占比提升而变长。 inet6Address, Integer mask, Integer localId) { if (inet6Address == null || localId == null || localId 通过上述代码使用定位数据的每一行调用 put 方法即可完成前缀树的构建,下边看下构建好的前缀树如何进行查找: public Integer get(Inet6Address inet6Address)

    1K20发布于 2021-04-12
  • 来自专栏用户1069690的专栏

    ThinkPHP6之EasyWeChat使用Redis储存access_token

    而共用一个公众号,首先会遇到的应该是access_token问题了,两个程序互相的去获取access_token,导致被“挤下线”。 access_token是公众号的全局唯一接口调用凭据,公众号调用各接口时都需使用access_token。开发者需要进行妥善保存。access_token的存储至少要保留512个字符空间。 $wechat->template_message->send([ 'touser' => 'dsadasdasdas', 'template_id' => 'vN_nAl6UiLbCnCT _-lwPoGgaMZUXvY0G72Rr3C-5k6o', 'url' => 'https://blog.ll00.cn', 'data' => [ , // 申请内容 'keyword1' => '钞票', // 预约时间 'keyword2' => '2020年66日',

    3.1K10编辑于 2022-05-18
  • 来自专栏用户7873631的专栏

    tp6token进行合法性验证(中间件)

    isset($header['token'])){//没有token的话,进行if里面 return json(['code'=>440,'msg'=>'request must with token ']); } $token = $header['token']; try{ $token = (new Parser())->parse($token);//token解析, $token->verify($signer,config('shop.API_KEY'))){ return json(['code'=>440,'msg'=>'token verify failed $token->validate($data)){ $mobile = $token->getClaim('mobile'); $token = getToken($mobile); return json(['code'=>450,'msg'=>'token expired','token'=>$token]); } return $next($request);

    80810编辑于 2022-05-25
  • 来自专栏iSharkFly

    Confluence 6 缓存性能优化

    https://www.cwiki.us/display/CONF6ZH/Cache+Performance+Tuning

    70830发布于 2019-01-30
  • 来自专栏测试开发干货

    【简历优化平台开发教程-6

    简历优化平台被搁置有半年之久,这期间,我尽力在帮大家优化简历,也在观察招聘市场的最新技术和要求等等。现在已经有了一些成果,所以这就继续更新简历优化平台。 【简历优化平台-0】设计和实现初稿方案 【简历优化平台-1】初始页面摞代码,简历从此自问答 【简历优化平台-2】四个部分初显现,上传按钮打头前 【简历优化平台-3】随机唯一标识,贯穿时间长河 【简历优化平台 -4】js魔改文件上传,django轻松接收 【简历优化平台-5】夜半撞见男女哭,form表单初运用 之前的五章开头小说部分就先不讲了,毕竟大家也懒得看,我也没精力编了... 红圈内是选择优化意向,接口路径为jiexi_resume。点击获得建议按钮后会触发提交表单,表单中带着优化建议。 完全体的话,会除了优化建议外,还有很多意向设置。 再来看看我们的后端部分: 可以看到,目前这个简历优化模块,只有这俩个函数,一个是进入页面,一个是上传简历,上传简历的时候唯一标识码会加到简历的名称之中,以防错乱。

    29720编辑于 2023-08-14
  • 来自专栏深度学习与python

    6 种 WebAssembly 的优化手段

    但对文件大小的优化并不是到此为止了,我们还有其他手段可以进一步优化二进制的大小。 利用编译选项的优化 部分编译器提供了内置的编译选项,以优化其所生成的二进制。 借助 wasm-opt 优化文件大小 并不是所有编译器都提供优化的选项,即使是提供优化选项的编译器可能也不会有十分明显的优化效果。 Wasm 的优化工具可以分析 Wasm 二进制文件稳健性的同时,进一步优化文件大小,甚至还可优化 Wasm 可执行文件的性能特征。 这种方式不仅削减了文件大小,同时也优化了运行时性能。在作者的电脑上,优化后的“Hello World”程序执行速度比没经过优化的要快上两倍。 至于 Wizer,我们其实只在 .NET  上用过,Wizer 在这方面的优化非常好用。 总   结 这 6优化 Wasm 性能及文件大小各有自己的优缺点,结合使用其中一些方法也可以增加效益。

    2K10编辑于 2023-04-21
  • 来自专栏GiantPandaCV

    解析 Token to Token Vision Transformer

    最后看下T2T,通过Token to Token结构(下文会讲),它在浅层的时候也能建模出结构信息,同时也避免了极值的出现。 Token To Token结构 ? 这样会逐渐减少token的数量,但随之而来token的长度会增加很多(因为多个tokens连接在一个token),因此后续模型也降低了维度数目,以平衡计算量。 下面是一段测试代码 import torch import numpy as np np_input = np.array([[[[1, 2, 3], [4, 5, 6] unfold(torch_input) print(unfolded) # 输出为 tensor([[[ 1., 2., 4., 5.], [ 2., 3., 5., 6. ], [ 4., 5., 7., 8.], [ 5., 6., 8., 9.], [10., 11., 13., 14.],

    8.1K10发布于 2021-03-11
  • 来自专栏Java进阶架构师

    「mysql优化专题」优化之路高级进阶——表的设计及优化6

    6) 自增字段要慎用,不利于数据迁移 7)强烈反对在数据库中存放 LOB 类型数据,虽然数据库提供了这样的功能,但这不是他所擅长的,我们更应该让合适的工具做他擅长的事情,才能将其发挥到极致。 (真的是技术文,欢迎补充) 优化③:索引 索引是一个表优化的重要指标,在表优化中占有极其重要的成分,所以上篇索引优化详解没看过的可以先看看,这里不再赘叙。 【mysql优化专题】相关 「mysql优化专题」这大概是一篇最好的mysql优化入门文章(1) 「mysql优化专题」90%程序员都会忽略的增删改优化(2) 「mysql优化专题」单表查询优化的一些小总结 ,非索引设计(3) 「mysql优化专题」你们要的多表查询优化来啦! 请查收(4) 「mysql优化专题」90%程序员面试都用得上的索引优化手册(5) 今天,表的设计及优化就讲到这里,重点是表的拆分(加分项)。觉得有收获的同学可以收藏关注。

    1K20发布于 2018-08-15
  • 来自专栏全栈程序员必看

    小米 token(token在哪里获取)

    小米设备token获取&HomeAssistant安装部署 小米智能设备token获取 miIO-discovery获取token与控制 app直接token获取 DB获取token 开源智能家居平台HomeAssistant 在使用这个局域网控制协议之前需要获取到设备token,接下来介绍小米设备获取token的一些方法。 :’,tok) 运行python3.5 miio_test.py,获取小米Wi-Fi插座token 执行控制脚本,输入插座的ip和token两个参数就可以看到现在插座的状态,在这两个参数的基础上添加 接下来还有一种方法可以直接从app获取token。以小米绿米网关为例,首先下载米家app,将绿米网关配置入网后,点击网关设备。接下来步骤如下组图,最后的密码即为网关的token。 目前绿米的这种设计模式是最方便用户的,而且设备的所有者还可以选择是否开放局域网控制以及刷新控制token的有效性,个人还是很希望小米的其他设备同样开放app侧获取设备token,因为毕竟获取需要搭建复杂的环境以及调试代码

    10.7K10编辑于 2022-07-29
  • 来自专栏云攻略专区

    Openlaw 网关 Token 激增与成本超标问题及优化研究方向

    Tokens 消耗指数级增长Tokens 资源供应严重不足模型调用费用持续超标二、研究方向(4 大核心)上游多种模型轮询调度技术多模型负载均衡、故障转移、优先级路由按任务复杂度自动分配大 / 小模型,降低整体 Token 消耗提升服务可用性,避免单点瓶颈模型 Prompt 提示词限制与 Token 节省技术精简指令、结构化提示、冗余信息剔除上下文压缩、历史对话摘要、长度硬限制优雅截断与缓存复用,在不降低效果前提下大幅省 Token中间件与 CodingPlan 共享消耗池技术构建 Token 共享消耗池,统一配额与限流中间件统一鉴权、计费、监控、熔断CodingPlan 任务编排与复用,减少重复调用与浪费本地化基础模型私有轻量化部署小 AI 多模型、AI 音视频数字人硬件智能方案多模型协同推理、音视频实时生成优化、数字人硬件加速方案、端云协同智能架构,提升表现力与运行效率。

    35810编辑于 2026-03-16
  • 来自专栏GiantPandaCV

    原理&图解vLLM Automatic Prefix Cache(RadixAttention)首Token时延优化

    这三个技术目前在TensorRT-LLM、vLLM这两个常用的LLM推理框架中都已经支持,因此,从应用落地的角度来说,理解这三个优化技术的原理也比较有意义。 token的耗时。 Only Prefix KV Caching (2)Prefix + Generated KV Caching的优化,多轮对话分析。 Arjunan||\n|F E B|13|6|Appooppan|Thikkurissi Sukumaran Nair, Kamal Haasan|P. Bhaskaran|M. S. Prefix Caching的优化思路,并非只有SGLang RadixAttention以及vLLM中的实现。

    15K32编辑于 2024-06-04
领券