首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • Token 计量与费用归因体系的设计

    AI 批量处理数据,当月成本暴增,事后才发现· 模型价格不一致:GPT-4o 和 GPT-4o-mini 单价差 20 倍,但用户选择模型往往没有约束二、计量体系的设计2.1 归因维度要做有意义的费用报告 · 模型分布:各模型的用量占比,评估是否在用「最贵但不必要」的模型· Token 效率:平均每次调用的 input/output token 比,比值异常往往意味着 prompt 设计有问题四、降低成本的工程手段 4.1 Prompt 压缩input token 是成本的大头。 合同漏洞率下降了多少,转化为潜在风险规避价值· 处理量提升:客服智能体上线后,单位时间处理的工单数量提升了多少背景参考 在我们接触的企业里,没有做成本归因体系的团队,AI 月均花费往往比预期高出 2- 建立归因体系后,通常在 1-2 个月内就能识别出主要的成本浪费点。ZGI(zgi.cn)的费用管控模块提供了从计量、归因到预算预警的完整体系,支持按部门独立预算管理。

    52910编辑于 2026-03-26
  • 来自专栏大数据文摘

    一次10万token!Claude2重磅发布,性能直逼GPT-4,不要钱免费用

    大数据文摘出品 就在刚刚,ChatGPT最大竞争对手发布了Claude 2!升级后的模型,在编码、数学和推理方面的性能都有所提高。 目前Claude 2的上下文窗口已经“卷”到100K个Token,意味着可以让它处理数百页的技术文档,甚至是一本书。 甚至还可提供实时编码数据可视化! 据网友评价:在一些指标上已经超过了GPT-4,目前100K token的上下文窗口,是目前模型中最大的,且拥有更快的处理速度。 也有网友评价,不如GPT-4! 与 Claude 1.3 相比,Claude 2 在给出无害回应方面的表现提高了2倍。 通过扩展步骤1和2中的每个主题句并添加结论来撰写一篇文章。请在<essay></essay>标记中包含文章。

    71120编辑于 2023-08-08
  • 来自专栏新智元

    GPT-4最大竞争对手Claude 2震撼发布!一次10万token费用,代码、数学、推理史诗级提升

    不仅如此,它还能做出更长的回答——支持高达100K token的上下文。 而且最重要的是,现在我们可以用中文和Claude 2对话了,而且完全免费! 在Codex HumanEval(Python函数合成)、GSM8k(小学数学问题)、MMLU(多学科问答)、QuALITY(非常长的故事问答测试,最多一万个token)、ARC-Challenge(科学问题 在每个prompt最多可以包含100k的token,这意味着:Claude 2可以一次读取几百页的技术文档,甚至一整本书! 并且,它的输出也更长了。 现在,Claude 2可以写长达几千个token的备忘录、信函、故事。 你可以上传PDF之类的文档,然后基于PDF进行对话,上下文的长度,比GPT要大。 喂给Claude 2超过8万3千字符的2个PDF文件之后,它完美完成了上述任务。 而且根据Anthropic官方在论文中的说法,Claude 2其实是有支持200k上下文的潜力。

    57520编辑于 2023-08-07
  • 来自专栏blackheart的专栏

    2.OAuth2授权(续) & JWT(JSON Web Token)

    1.1 撤销Token 在上篇[认证授权] 1.OAuth2授权 中介绍到了OAuth2可以帮我们解决第三方Client访问受保护资源的问题,但是只提供了如何获得access_token,并未说明怎么来撤销一个 关于这部分OAuth2单独定义了一个RFC7009 - OAuth 2.0 Token Revocation来解决撤销Token问题。 2 OAuth2 Token 撤销(RFC7009 - OAuth2 Token Revocation) 简单来说,这个协议规定了一个Authorization server提供一个怎样的API来供Client 3 OAuth2 Token 元数据(RFC7662 - OAuth2 Token Introspection) 简单的总结来说,这个规范是为OAuth2扩展了一个API接口(Introspection Token 元数据 这一小节中,OAuth2返回Token的元数据的JSON,以及OAuth2中的access_token对Client是不透明的字符串这件事,我们可以把access_token的元数据信息用

    2.1K50发布于 2018-01-19
  • 来自专栏Eliauk的小窝

    Sa-Token整合OAuth2

    Sa-Token整合OAuth2 开源地址 https://gitee.com/ZVerify/zverify-blog 为什么要整合OAuth2 有些时候我们自己写的网站注册过于繁琐需要每个用户花费时间去注册 写之前思考一下 我们先想一下我们在进行第三方登录的时候是怎样的一个步骤,首先第三方登录都需要遵守OAuth2的流程,这里我使用了授权码模式,对于其他三种授权模式请参考网络文章,因为我使用了授权码模式所以他的整体流程都是一样的 ,首先前端通过访问网站拿到授权的code,然后回调我们后端的接口,此时只有code是变化的所以只需要接收到code,然后获取access_token ,拿到access_token之后我们可以去获取第三方用户信息 (access_token).openId(data).loginType(LoginTypeEnum.GITEE.getType()).build(); } 拿到access_token封装到对象中 通过access_token获得用户信息 然后通过access_token去访问gitee提供的通过access_token拿到用户信息的接口 @Override public SocialUserInfoDTO

    3.4K30编辑于 2022-11-15
  • 来自专栏码匠的流水账

    spring security oauth2之refresh token

    序 本文就来讲一讲spring security oauth2的refresh token方式 authorizedGrantTypes oauth2官方只有4种授权方式,不过spring security oauth2把refresh token也归为authorizedGrantTypes的一种,因此配置的时候只需要这样就把所有方式都支持了 @Configuration @EnableAuthorizationServer OAuth2ServerConfig extends AuthorizationServerConfigurerAdapter { @Override public void configure "password", "implicit") .scopes("all") .resourceIds("oauth2- ":"a78999d6-614a-45fe-be58-d5e0b6451bdb","token_type":"bearer","refresh_token":"bb2a0165-769d-43b0-a9a5

    4.2K20发布于 2018-09-17
  • 来自专栏新智元

    百亿token费用!国产平台一键拖拽定制大模型,多元算力极具性价比

    这家国产平台从今日起,免费送百万token。开发者们不仅可以对20多种开源模型精调,还能用上极具性价比的多元算力。 有人调侃,比起「造福人类」,大模型更应该先呼吁「给我场景」。 开发者可以在这个平台上体验、对比各种模型能力和芯片效果,通过简单拖拽各种参数按钮的动作,就能精调出更贴合业务的大模型并部署在无穹Infini-AI上,再以非常优惠的千token单价向用户提供服务。 目前,无穹Infini-AI已支持了Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪 第三方平台或自定义训练、微调而来的模型也可以无缝迁移托管到无穹Infini-AI,并获得细粒度定制化的按token计费方案。 一年后,无问芯穹宣布了在英伟达GPU和AMD等芯片上取得的优化效果,实现了大模型任务2-4倍的推理速度提升。随后,AMD中国宣布与无问芯穹达成战略合作关系,双方将携手联合提高商用AI应用性能。

    1.8K10编辑于 2024-04-12
  • 来自专栏码匠的流水账

    spring security oauth2使用redis存储token

    序 本文就来讲述一下spring security oauth2使用redis来存储token的配置及在redis中的存储结构 maven <dependency> <groupId token, OAuth2Authentication authentication) { byte[] serializedAccessToken = serialize(token 排除refresh_token,主要key如下: auth_to_access:OAuth2Authentication相关信息加密后的值,value为string结构 这个主要是通过OAuth2Authentication 来获取OAuth2AccessToken auth:token值,value为string结构 这个主要用来获取token的OAuth2Authentication,用来获取相应的权限信息 client_id_to_access token值,value为string 这个主要是通过token值来获取OAuth2AccessToken uname_to_access:clientId:userId,value的结构是list 存储

    3.7K00发布于 2018-09-17
  • 来自专栏GiantPandaCV

    解析 Token to Token Vision Transformer

    最后看下T2T,通过Token to Token结构(下文会讲),它在浅层的时候也能建模出结构信息,同时也避免了极值的出现。 Token To Token结构 ? T2T结构 Vision Transformer是将二维图片展平成一维向量(也叫token),然后送入到Transoformer结构里。 而T2T为了捕捉局部信息,它将所有的token通过reshape操作,恢复成二维,然后利用一个unfold一个划窗操作,属于一个窗口的tokens,会连接成一个更长的token,然后送入到Transformer 整体架构 T2T架构如上图所示,先经过2次Tokens to Token操作,最后给token加入用于图像分类的cls token,并给上位置编码(position embedding),送入到Backbone 输出再次经过LayerNorm,最后设置一定比例的Dropout T2T Module class T2T_module(nn.Module): """ Tokens-to-Token

    8K10发布于 2021-03-11
  • 来自专栏golang分享

    日志费用计算

    由于服务器有多个规格,不同规格服务器能插的硬盘个数是不同的,情况如下面列表所示: 普通 1u 服务器 能插 4 个 3.5 硬盘 、SSD 硬盘 2 个 普通 2u 服务器 能插 12 个 3.5 硬盘 这里如果使用 2u 服务器,那么需要的服务器数量就是 12 台(144 块硬盘 /12 = 12 台)。 根据服务器托管推算维护费用2u 服务器托管在较好的机房里, 每台服务器托管的费用每年大概是 1W 元。前面我们算过服务器需要 12 台,那么一年的托管费用就是 12W 元。 现在我们来算算第一年的投入是多少,这个投入包括硬盘的投入及维护费用、服务器的硬件费用和托管费用,以及宽带费用。 )、服务器的维护费用和宽带费用

    6.2K31编辑于 2023-11-30
  • 来自专栏CodeGuide | 程序员编码指南

    QClaw干掉10亿Token,做出2个精致skills!

    但不深度玩,不干它几亿Token,就不能体验到花钱的快乐!好在呀,好在QClaw每天一个登录的账号,赠送4000万Token。换5个微信(还得家里人多),就是2亿Token! 先拿10亿Token,写2个Skills之后再说(先把腿接上)。——把你工作的方式,训练成技能,让AI懂你!接下来,小傅哥就分享下,用OpenClaw(QClaw)做的一些事。 2.龙虾社群地址:https://wx.zsxq.com/group/48885154455258说明:现在OpenClaw养虾社区就已经入住了很多小龙虾,欢迎一起来玩下。 经过仅2周的折腾,目前发布了xfg-ddd-skillsv2.2.1版本,可以满足DDD六边形架构设计和编码实现。 只要有Token就想让AI继续搞。软件工程交付,需要的不只是代码,还包括完整的理解代码,代码与产品PRD完全匹配,从而形成代码资产。

    1.3K160编辑于 2026-03-30
  • 来自专栏玉树芝兰

    如何免费用 Qwen2 辅助你翻译与数据分析?

    当时我也写了几篇文章来介绍这个系列模型,例如这一篇《如何免费用 Llama3 70B 帮你做数据分析与可视化》,很受欢迎。 最近阿里推出了新一代的开源大语言模型 Qwen2。 因为信息比较多,我干脆让 Perplexity 给我对 Qwen2 的信息做了个汇总。 我这里拿了一张 Qwen2 发布会时的图,它展示了 Qwen2 的 72B 与 Llama3 的 70B 以及 Mixtral-8x22B 混合专家模型间的对比。 答案是我故意的因为Qwen2号称多语言能力比较强,所以我们先让它试试这种混用看效果怎么样。 测试结果来看,Qwen2 对中英文混合的 prompt 理解效果挺好。 代码完整输出完后,Qwen2 还会告诉用户怎么用。 我于是先按照它的要求把 Pygame 安装上。 之后,我把 Qwen2 生成的代码贴到 Visual Studio Code 里面,再执行。

    63210编辑于 2024-06-13
  • 来自专栏数字化之路

    Spring Security OAuth2是如何校验token

    即承担校验token的职责 校验token 下面的代码涉及到的spring-security-oauth2的版本: <dependency> <groupId>org.springframework.security.oauth access_token=f732723d-af7f-41bb-bd06-2636ab2be135 // //支持此特性的代码实现,key为access_token的参数 request.getParameter (OAuth2AccessToken.ACCESS_TOKEN); 2.1.3 在form表单中携带 http://localhost:8080/accounts/me form param: access_token =f732723d-af7f-41bb-bd06-2636ab2be135 // //支持此特性的代码实现,key为access_token的参数 request.getParameter(OAuth2AccessToken.ACCESS_TOKEN Trying request parameters."); token = request.getParameter(OAuth2AccessToken.ACCESS_TOKEN);

    5.7K20编辑于 2023-03-07
  • 来自专栏全栈程序员必看

    小米 token(token在哪里获取)

    小米设备token获取&HomeAssistant安装部署 小米智能设备token获取 miIO-discovery获取token与控制 app直接token获取 DB获取token 开源智能家居平台HomeAssistant 首先搭建Python环境: 安装Python3.5依赖(本机存在的会忽略) sudo apt-get install build-essential libsqlite3-dev sqlite3 bzip2 libbz2-dev libssl-dev openssl libgdbm-dev liblzma-dev libreadline-dev libncursesw5-dev 编译安装Python3.5 DB获取token  第1步,获取一部安卓手机的root权限  第2步,安装米家app并登录账号  第3步,进入/data/data/com.xiaomi.smarthome/databases /  第4步,拷贝miio2.db,下载到电脑  第5步,前往网站(http://miio2.yinhh.com/),上传miio2.db,点击提交,即可获得token

    10.2K10编辑于 2022-07-29
  • 来自专栏SAP ERP管理实践

    SAP 费用报销操作

    费用报销操作包括: 在资金计划内付款,如之前有预付过货款,则进行 预付应付清账; 在资金计划内付款,如之前没有预付过货款,则根据需要支付的金额和明细进行应付清账。 费用报销用于冲销之前的员工借款,进行清账,冲销个人借款(F-30) 步骤1:输入待清账相关信息 ? 步骤2:输入清账金额和起息日 ? 步骤3:输入原因代码 ?

    6.4K30发布于 2019-06-19
  • 来自专栏全栈程序员必看

    token身份认证机制(token怎么获取)

    目录 1 发展史 2 Cookie 3 Session 3.1 cookie和session的区别 4 Token 4.1 传统方式——基于服务器的验证 4.2 基于服务器验证方式暴露的一些问题 4.3 2、但是随着交互式Web应用的兴起,像在线购物网站,需要登录的网站等等,马上就面临一个问题,那就是要管理会话,必须记住哪些人登录系统, 哪些人往自己的购物车中放商品, 也就是说我必须把每个人区分开, 2 Cookie cookie 是一个非常具体的东西,指的就是浏览器里面能永久存储的一种数据,仅仅是浏览器实现的一种数据存储功能。 实现思路: 1.用户登录校验,校验成功后就返回Token给客户端。 2.客户端收到数据后保存在客户端 3.客户端每次访问API是携带Token到服务器端。 4.服务器端采用filter过滤器校验。 使用 token 完美解决了此问题。 (2)安全性 请求中发送 token 而不是 cookie,这能够防止 CSRF(跨站请求伪造) 攻击。

    7K10编辑于 2022-07-29
  • 来自专栏SAP最佳业务实践

    SAP制造费用核算

    ,工单被Debit,意思是工单从成本中心吸收成本过来;制造费用的核算比起前两者稍显复杂,这里简单做一个说明。 首先,按制造费用项目设置初级成本要素(Category = 1),用来归集实际发生的制造费用, Dr:制造费用(1)-XX成本中心 10万 Cr:银行存款/… 10万 接下来,按制造费用项目设置对应的次级成本要素 (Category = 41),用来归集工单制造费用,期末工单Apply Overhead之后, Dr:制造费用(41)-工单 9.5万(计算规则:Costing Sheet.Credit = Base _*Percentage) Cr:制造费用(41)-XX成本中心 9.5万 期末,计算成本中心(XX成本中心)制造费用的借方数(Debit,实际发生额)与贷方数(Credit,工单吸收部分)的差额,V = 制造费用(1) - 制造费用(41),V <0,表明成本中心被过渡吸收(Over Absorption),反之,则是Under Absorption, 最后,编制制造费用差异结转凭证(期末手工编制)

    3K40发布于 2018-03-27
  • 来自专栏数据结构与算法

    Day5费用

    算法 zkw费用流:多路增广,增光 的边 无源汇上下界最小费用可行流 每次强行增加下界的流量 类似网络流,拆边 原边的费用为c,拆出来的边费用为0 负边和负圈 直接应用 SDOI2016数字配对 我的思路 : 建出 个点,如果ai是aj的质数倍,从bi个点向bj个点连边 跑有上下界可行费用最大流(woc这是个什么东西。。) 正解 两个数能够配对,分解后指数之和差为1则可以匹配 按照差值分为两类 不断增广 WF2011 有上下界最大费用最大流 ——》限制相等的情况,可以通过加一维费用来解决 时间复杂度: 回路问题 TJOI2013 找出入度不为1的点, 枚举是否更改(好傻逼) 正解 黑白染色,建二分图 从一个点向四个方向连边,(1,0) (1,1)(1,1) (1,1) Topcoder 黑白染色后对度数进行限制 考虑如何处理费用 拆点,把一个点拆成两个,连流量为1的边,如果是直的,那么一定会经过中间的边,问题便可以得到解决 费用递增 美食节 JSOI2009球队XX 平方的性质满足费用递增 WC2007 签到问题  二分图模型

    6.6K60发布于 2018-04-11
  • 来自专栏友人a的笔记丶

    详细了解 Cookie、Session、Token以及oauth2、jwt

    比如用 2 个机器组成了一个集群,小 F 通过机器 A 登录了系统,那 Session ID 会保存在机器 A 上,假设小 F 的下一次请求被转发到机器 B 怎么办? 那只好做 Session 的复制了,把 Session ID 在 2 个机器之间搬来搬去,非常累。 基于 Token 的身份验证的过程如下: 用户通过用户名和密码发送请求 程序验证 程序返回一个签名的 token 给客户端 客户端储存 token,并且每次用于每次发送请求 服务端验证 token 并返回数据 加载中... 2.安全性 请求中发送 token 而不再是发送 cookie 能够防止(跨站请求伪造(CSRF)。 我们也不一定需要等到 token 自动失效,token 有撤回的操作,通过 to- ken revocataion 可以使一个特定的 token 或是一组有相同认证的 token 无效。

    75540编辑于 2023-02-17
  • 来自专栏全栈程序员必看

    无效的token怎么解决_登录token

    大家好,又见面了,我是你们的朋友全栈君 解决无效token的方法 在调用API接口时遇到了无效token的问题,网上搜了一大圈还以为是token时效的问题,最后发现是给需要授权的 API , 必须在请求头中使用Authorization 字段提供 token 令牌。 // 在最后必须return return config }) 然后在请求头中可以发现Authorization的值还是Null,原因就是当你发送的发出的是登录请求,在登录期间服务器没有给你token ,如果登录之后调用其他接口再去监听这次请求的话就会发现Authorization的值不在是null了,而是登录后的token。 根据授权(Authorization)的解释,之所以要这么做的原因就是要给token授权访问api接口的权限。 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。

    4.4K40编辑于 2022-09-30
领券