首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Hank’s Blog

    3-4 列表的子集

    #列表的子集 Subsetting List #[[]] / $ / [[]][] / [[]][[]] #嵌套列表 /不完全匹配(partial matching) > x <- list(id=1:4,height=170,gender="male") > x[1] #找第1列的元素 $`id` [1] 1 2 3 4 > x["id"] #两个函数作用相同 $`id` [1] 1 2 3 4 > x[[1]] [1] 1 2 3 4 > x[["id"]] [1] 1 2 3 4 > x

    98010发布于 2020-09-16
  • 来自专栏AI SPPECH

    Token Runtime:成本控制与性能优化

    目录 1 引言:为什么Token管理是AI IDE的生命线 2 Token计数:文本到Token的映射与优化 2.1 Tokenization的数学原理 2.2 主流模型的Token计数差异 2.3 Token 计数器的工程实现 2.4 Token计数的精确度优化 2.5 Token计数与成本模型 3 使用量追踪:多维度统计体系设计 3.1 追踪架构设计 3.2 追踪数据模型 4 预算控制:多层次成本约束机制 2 Token计数:文本到Token的映射与优化 本节为你提供的核心技术价值:掌握主流模型的Token计数原理,理解不同编码方式的差异与优化策略 2.1 Tokenization的数学原理 Token是 线程安全:支持高并发场景 9.3 未来演进方向 智能化增强 基于强化学习的自适应压缩策略 更精准的任务复杂度预测 用户习惯学习与个性化路由 多模态扩展 图像Token的计量与优化 音视频内容的上下文管理 Runtime Complete - 完整代码请参见本文各章节实现") 关键词: Token Runtime, AI IDE, 成本控制, 性能优化, 预算管理, 上下文压缩, 缓存策略, 模型选择,

    25010编辑于 2026-05-27
  • 来自专栏养虾记

    优化 OpenClaw Heartbeat,大幅减少 Token 消耗

    完整实战指南:通过架构重构将HeartbeatToken消耗降低95%目录问题背景与痛点分析Heartbeat工作机制深度解析优化策略与架构重构详细实施步骤进阶优化技巧监控与故障排查优化效果量化分析总结与最佳实践一 ────────────────────┐│优化前的Token消耗结构│├──────────────────────────────────────────────────────────────── **如无异常→回复HEARTBEAT_OK**优化效果:字数:500字→50字Token:约800→约100节省:约87.5%4.3第三步:创建Cron任务4.3.1查看现有Cron任务展开代码语言:BashAI 7.1Token消耗对比优化前(每日):项目次数单次Token总计TokenHeartbeat484,000192,000任务执行48包含在心跳中-总计--192,000优化后(每日):项目次数单次Token $1.92$0.26$1.66每月$57.60$7.80$49.80每年$691.20$93.60$597.607.3性能对比指标优化优化后提升心跳响应时间5-10秒1-2秒5x上下文长度5000+Token1800Token64%

    4.1K21编辑于 2026-03-24
  • 来自专栏python3

    3-4 文件读写例子

    n学习通过文件流FileStream打开文本文件、写入文本文件、设置文件属性、实施对文件的目录操作管理的基本方法

    1.2K30发布于 2020-01-14
  • 来自专栏python3

    3-4 文件读写例子(2)

    向项目中添加名为FileOption.cs的类文件,并准备填写关于文件操作的各种方法,如图3-8所示:

    57830发布于 2020-01-14
  • 来自专栏python3

    3-4 文件读写例子(4)

    /*******************************************************

    54430发布于 2020-01-14
  • 来自专栏python3

    3-4 文件读写例子(3)

    //==============================第二部分:类设计============================

    55410发布于 2020-01-08
  • Claude Code 省钱指南:Token 成本优化实战

    用了ClaudeCode一段时间,发现Token消耗量比你想象的要高?这篇文章帮你系统性地降低Token成本。 一、理解Token计费1.1输入Tokenvs输出TokenClaude的计费区分输入和输出:Token类型说明价格相对输入Token发送给Claude的内容(你的消息+文件+系统提示)较低输出TokenClaude 二、零成本优化:用好免费额度2.1识别高消耗场景消耗token的「大户」:场景典型消耗说明读取大文件10-100K+一次请求就消耗大量输入token长对话历史累计增长每轮对话都带上之前的内容反复读取相同文件浪费没有利用缓存输出生成高额输出 &&/cost知道钱花在哪,才能有针对性地优化。 3.2CLAUDE.md优化CLAUDE.md是缓存的「黄金地段」——每次请求都会带上,且位置靠前。

    1.6K12编辑于 2026-05-24
  • Claude Code 省钱指南:Token 成本优化实战

    用了 Claude Code 一段时间,发现 Token 消耗量比你想象的要高?这篇文章帮你系统性地降低 Token 成本。 一、理解 Token 计费 1.1 输入 Token vs 输出 Token Claude 的计费区分输入和输出: Token 类型 说明 价格相对 输入 Token 发送给 Claude 的内容(你的消息 二、零成本优化:用好免费额度 2.1 识别高消耗场景 消耗 token 的「大户」: 场景 典型消耗 说明 读取大文件 10-100K+ 一次请求就消耗大量输入 token 长对话历史 累计增长 每轮对话都带上之前的内容 /context && /cost 知道钱花在哪,才能有针对性地优化。 3.2 CLAUDE.md 优化 CLAUDE.md 是缓存的「黄金地段」——每次请求都会带上,且位置靠前。

    23610编辑于 2026-06-15
  • 来自专栏python3

    3-4 文件流类FileStream

    nFileMode和FileAccess,FileShare方法基本介绍及注意事项

    1.1K20发布于 2020-01-07
  • 多模态理解模型的Token消耗优化策略

    摘要: 多模态理解模型按Token消耗量计费,优化Token使用是控制成本的关键。 理解这些规律,是制定Token消耗优化策略的基础。 6.3 定期评估优化效果 Token消耗优化是一个持续的过程。 建议定期(如每月)对优化措施的效果进行评估,包括: 平均单次调用的Token消耗量是否下降 不同优化措施的实际降本效果 优化措施是否对理解准确性产生影响 基于定期评估的结果,持续调整和优化Token消耗策略 七、成本与效果的平衡 7.1 避免过度优化 Token消耗优化需要在成本和效果之间取得平衡。过度追求Token消耗的降低,可能会对理解准确性产生负面影响,反而导致业务质量的下降。

    12110编辑于 2026-06-18
  • 来自专栏用户画像

    4.4 文件系统疑难点 3-4

    为了创建一个文件,应用程序调用逻辑文件系统。逻辑文件系统知道目录结构形式。它将分配一个新的FCB给文件,把相应目录读入内存,用新的文件名更新该目录和FCB,并将结果写回到磁盘。

    73610发布于 2018-08-24
  • 来自专栏叽叽西

    lagou 爪哇 3-4 spring cloud 问答笔记

    生成 token 并入库 【1. token 写入 cookie 中 【2. 根据 email 知道对应的 用户信息 Token token = findOne.get(); String originPassword = token.getPassword 将 token 信息返回前端 【2. 认证, 验证客户端请求cookie中携带的token是否合法,合法则放⾏,此处不考虑token更新问题) 这里我的实现方式原本想的是调用了 code 服务的验证 token接口的, 但是我使用的lagou_token

    63620编辑于 2022-05-17
  • 来自专栏GiantPandaCV

    解析 Token to Token Vision Transformer

    最后看下T2T,通过Token to Token结构(下文会讲),它在浅层的时候也能建模出结构信息,同时也避免了极值的出现。 Token To Token结构 ? 而T2T为了捕捉局部信息,它将所有的token通过reshape操作,恢复成二维,然后利用一个unfold一个划窗操作,属于一个窗口的tokens,会连接成一个更长的token,然后送入到Transformer 这样会逐渐减少token的数量,但随之而来token的长度会增加很多(因为多个tokens连接在一个token),因此后续模型也降低了维度数目,以平衡计算量。 整体架构 T2T架构如上图所示,先经过2次Tokens to Token操作,最后给token加入用于图像分类的cls token,并给上位置编码(position embedding),送入到Backbone 结构对比 代码解读 Token Transformer class Token_transformer(nn.Module): def __init__(self, dim, in_dim,

    8.1K10发布于 2021-03-11
  • 来自专栏爬虫逆向案例

    Js逆向-猿人学(3-4)访问逻辑-样式干扰

    第三题和第四题跟Js逆向没有什么关系,本来是不想发的,为了排版好看也发这个专栏里吧。

    74930发布于 2021-11-22
  • 来自专栏人工智能与演化计算成长与进阶

    16推荐系统3-4协同过滤算法

    假如用户给予了他自身的偏好特征 ,而我们需要根据这些信息求出电影的特征向量 从让所有已经评价过电影的用户 j 的偏好特征和电影的特征相乘算法会预测出一个用户可能对当前电影的评价然后和实际用户对电影的评分相比较,通过优化参数 我们的优化目标便改为同时针对 x 和 θ 进行。 ? 注意 ,此时 x 和 都是 n 维向量,即去掉了截距项 ,因为协同过滤算法可以自行选择和学习特征,所以不需要把 固定为 1。

    94111发布于 2020-08-14
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 3-4 创建Numpy数组(和矩阵)

    Notes: zeros 和 ones 函数创建的数组默认为浮点型,而 full 函数 dtype 默认为 None 类型,所以如果在使用 full 不指定 dtype 的情况下,默认为传入 fill_value 值的类型。

    98710编辑于 2022-05-25
  • 来自专栏云攻略专区

    Openlaw 网关 Token 激增与成本超标问题及优化研究方向

    Tokens 消耗指数级增长Tokens 资源供应严重不足模型调用费用持续超标二、研究方向(4 大核心)上游多种模型轮询调度技术多模型负载均衡、故障转移、优先级路由按任务复杂度自动分配大 / 小模型,降低整体 Token 消耗提升服务可用性,避免单点瓶颈模型 Prompt 提示词限制与 Token 节省技术精简指令、结构化提示、冗余信息剔除上下文压缩、历史对话摘要、长度硬限制优雅截断与缓存复用,在不降低效果前提下大幅省 Token中间件与 CodingPlan 共享消耗池技术构建 Token 共享消耗池,统一配额与限流中间件统一鉴权、计费、监控、熔断CodingPlan 任务编排与复用,减少重复调用与浪费本地化基础模型私有轻量化部署小 AI 多模型、AI 音视频数字人硬件智能方案多模型协同推理、音视频实时生成优化、数字人硬件加速方案、端云协同智能架构,提升表现力与运行效率。

    35910编辑于 2026-03-16
  • 来自专栏GiantPandaCV

    原理&图解vLLM Automatic Prefix Cache(RadixAttention)首Token时延优化

    这三个技术目前在TensorRT-LLM、vLLM这两个常用的LLM推理框架中都已经支持,因此,从应用落地的角度来说,理解这三个优化技术的原理也比较有意义。 (1)只有Prefix Caching的优化,多轮对话分析。如下图所示,只有Prefix Caching时,每个新的轮次对话中,总是会有2个片段的prompt需要在prefill阶段进行计算。 token的耗时。 Only Prefix KV Caching (2)Prefix + Generated KV Caching的优化,多轮对话分析。 Prefix Caching的优化思路,并非只有SGLang RadixAttention以及vLLM中的实现。

    15K32编辑于 2024-06-04
  • 来自专栏全栈程序员必看

    小米 token(token在哪里获取)

    小米设备token获取&HomeAssistant安装部署 小米智能设备token获取 miIO-discovery获取token与控制 app直接token获取 DB获取token 开源智能家居平台HomeAssistant 在使用这个局域网控制协议之前需要获取到设备token,接下来介绍小米设备获取token的一些方法。 :’,tok) 运行python3.5 miio_test.py,获取小米Wi-Fi插座token 执行控制脚本,输入插座的ip和token两个参数就可以看到现在插座的状态,在这两个参数的基础上添加 接下来还有一种方法可以直接从app获取token。以小米绿米网关为例,首先下载米家app,将绿米网关配置入网后,点击网关设备。接下来步骤如下组图,最后的密码即为网关的token。 目前绿米的这种设计模式是最方便用户的,而且设备的所有者还可以选择是否开放局域网控制以及刷新控制token的有效性,个人还是很希望小米的其他设备同样开放app侧获取设备token,因为毕竟获取需要搭建复杂的环境以及调试代码

    10.7K10编辑于 2022-07-29
领券