首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏人工智能

    从“词元”到“符元”:Token 中文名背后的 AI 底层认知之争

    随后,《人民日报》发文《专家解读token中文名为何定为“词元”》,对这一命名从专业角度进行了系统阐释。文中提到,“token”一词源于古英语tācen,意为“符号”或“标记”。 在语言模型中,token是文本经过切分或字节级编码后得到的最小离散单元,既可以表现为词、子词、词缀或字符等不同形式。模型正是通过对token序列的建模,展现出一定的智能能力。 在现代计算体系中,Token真正的结构本体是“离散符号单元”,而非单一模态的语言单位。 相比之下,「符元」直接对齐了跨模态计算的符号本体,它定义的不是Token的“过去”,而是Token的“真相”。 五、本体的回归:Token本质上是“符号”,而非“词”文章观点(通用解释):Token是语言模型中用于处理文本的最小单位。

    19310编辑于 2026-04-09
  • 来自专栏刷题笔记

    7-3 打印沙漏

    点这里 7-3 打印沙漏 本题要求你写个程序把给定的符号打印成沙漏的形状。

    62920发布于 2019-11-08
  • 来自专栏繁花云

    7-3笔记

    对数的定义:一般地,如果ax=N(a>0,且a≠1),那么数x叫做以a为底N的对数,记作x=logaN,读作以a为底N的对数,其中a叫做对数的底数,N叫做真数。

    50100发布于 2018-07-31
  • 来自专栏以终为始

    7-3 情人节 (15 分)

    输入按照点赞的先后顺序给出不知道多少个点赞的人名,每个人名占一行,为不超过10个英文字母的非空单词,以回车结束。一个英文句点.标志输入的结束,这个符号不算在点赞名单里。

    16520编辑于 2023-03-09
  • 来自专栏刷题笔记

    7-3 约瑟夫环 (25 分)

    本文链接:https://blog.csdn.net/shiliang97/article/details/101472782 7-3 约瑟夫环 (25 分) N个人围成一圈顺序编号,从1号开始按1、

    1K10发布于 2019-11-08
  • 来自专栏森破笔记

    解决git status中文名乱码

    git-config - Get and set repository or global options

    80710发布于 2020-04-10
  • 来自专栏刷题笔记

    7-3 电话聊天狂人 (25 分)

    点这里 7-3 电话聊天狂人 (25 分) 给定大量手机用户通话记录,找出其中通话次数最多的聊天狂人。 输入格式: 输入首先给出正整数N(≤10​5​​),为通话记录条数。

    1K20发布于 2019-11-08
  • 来自专栏sktj

    Django 下载文件返回中文名

    Django下载中文名文件: from django.utils.http import urlquote from django.http import HttpResponse content =

    61220编辑于 2022-05-14
  • 来自专栏刷题笔记

    7-3 寻找大富翁 (50分)

    胡润研究院的调查显示,截至2017年底,中国个人资产超过1亿元的高净值人群达15万人。假设给出N个人的个人资产值,请快速找出资产排前M位的大富翁。

    1.4K10发布于 2020-06-23
  • 来自专栏以终为始

    7-3 树的同构 (25 分)

    7-3 树的同构 (25 分) 给定两棵树T1和T2。如果T1可以通过若干次左右孩子互换就变成T2,则我们称两棵树是“同构”的。

    20810编辑于 2023-03-09
  • 来自专栏arebirth重生者的IT之路

    java 实现文件下载中文名不显示

    需要将指定字符串的编码转换成浏览器里面的ISO-8859-1编码 String name = new String(name.getBtes("utf-8"),"ISO-8859-1"); 示例: response.setContentType("application/octet-stream"); response.setHeader("content-disposition", "attachement;filename=" + new String(fileInfo.getFileName().ge

    70610发布于 2020-06-19
  • 来自专栏架构师进阶

    Java文件下载中文名不显示&乱码

    实际开发中遇到了中文名不显示的问题,一开始以为是后台代码的原因,网上查了一些资料,原来是Header中只支持ASCII,传输的文件名必须是ASCII。为什么Header只支持ASCII呢?。

    1.6K30发布于 2019-08-08
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 7-3 求数据的主成分pca

    首先创建一个虚拟的测试样本,样本具有两个特征,并且两个特征之间具有相应的线性关系。这里之所以让两个特征之间具有一定的线性关系是因为对这样的两个特征进行降维效果会比较明显。

    75650发布于 2019-11-13
  • 来自专栏GiantPandaCV

    解析 Token to Token Vision Transformer

    最后看下T2T,通过Token to Token结构(下文会讲),它在浅层的时候也能建模出结构信息,同时也避免了极值的出现。 Token To Token结构 ? 而T2T为了捕捉局部信息,它将所有的token通过reshape操作,恢复成二维,然后利用一个unfold一个划窗操作,属于一个窗口的tokens,会连接成一个更长的token,然后送入到Transformer 这样会逐渐减少token的数量,但随之而来token的长度会增加很多(因为多个tokens连接在一个token),因此后续模型也降低了维度数目,以平衡计算量。 整体架构 T2T架构如上图所示,先经过2次Tokens to Token操作,最后给token加入用于图像分类的cls token,并给上位置编码(position embedding),送入到Backbone 结构对比 代码解读 Token Transformer class Token_transformer(nn.Module): def __init__(self, dim, in_dim,

    8K10发布于 2021-03-11
  • 来自专栏刷题笔记

    7-3 堆栈操作合法性 (20 分)

    本文链接:https://blog.csdn.net/shiliang97/article/details/98609302 7-3 堆栈操作合法性 (20 分) 假设以S和X分别表示入栈和出栈操作。

    1.4K20发布于 2019-11-08
  • 来自专栏全栈程序员必看

    小米 token(token在哪里获取)

    小米设备token获取&HomeAssistant安装部署 小米智能设备token获取 miIO-discovery获取token与控制 app直接token获取 DB获取token 开源智能家居平台HomeAssistant 在使用这个局域网控制协议之前需要获取到设备token,接下来介绍小米设备获取token的一些方法。 :’,tok) 运行python3.5 miio_test.py,获取小米Wi-Fi插座token 执行控制脚本,输入插座的ip和token两个参数就可以看到现在插座的状态,在这两个参数的基础上添加 接下来还有一种方法可以直接从app获取token。以小米绿米网关为例,首先下载米家app,将绿米网关配置入网后,点击网关设备。接下来步骤如下组图,最后的密码即为网关的token。 目前绿米的这种设计模式是最方便用户的,而且设备的所有者还可以选择是否开放局域网控制以及刷新控制token的有效性,个人还是很希望小米的其他设备同样开放app侧获取设备token,因为毕竟获取需要搭建复杂的环境以及调试代码

    10K10编辑于 2022-07-29
  • 来自专栏freesan44

    PTA 7-3 拼题 A 是真爱 (20 分)

    如果一个人在一段话里很多次提到 pintia,那对拼题 A 就是真爱啦~ 本题就请你检查一下给定的文字中出现了几次 pintia。

    37610编辑于 2021-12-06
  • 来自专栏数据结构和算法

    7-3 调查电视节目受欢迎程度 (15分)

    7-3 调查电视节目受欢迎程度 (15分) 某电视台要调查观众对该台8个栏目(设相应栏目编号为1~8)的受欢迎情况,共调查了n位观众(1≤n≤1000),现要求编写程序,输入每一位观众的投票情况(每位观众只能选择一个最喜欢的栏目投票

    28710编辑于 2023-11-30
  • 来自专栏全栈程序员必看

    token身份认证机制(token怎么获取)

    这个token 我不保存,当小F把这个token 给我发过来的时候,我再用同样的HMAC-SHA256 算法和同样的密钥,对数据再计算一次签名, 和token 中的签名做个比较, 如果相同, 我就知道小 客户端储存 token, 并且每次请求都会附带它。 服务端验证 token 并返回数据。 每一次请求都需要TokenToken 应该在 HTTP的头部发送从而保证了 Http 请求无状态。 校验成功则返回请求数据,校验失败则返回错误码 当我们在程序中认证了信息并取得 token 之后,我们便能通过这个 token 做许多的事情。 使用 token 完美解决了此问题。 (2)安全性 请求中发送 token 而不是 cookie,这能够防止 CSRF(跨站请求伪造) 攻击。 我们也不一定需要等到token自动失效,token有撤回的操作,通过 token revocataion可以使一个特定的 token 或是一组有相同认证的 token 无效。

    7K10编辑于 2022-07-29
  • 来自专栏freesan44

    PTA 7-3 拼题 A 是真爱 (20 分)

    如果一个人在一段话里很多次提到 pintia,那对拼题 A 就是真爱啦~ 本题就请你检查一下给定的文字中出现了几次 pintia。

    51800发布于 2021-09-10
领券