王子健
从“词元”到“符元”:Token 中文名背后的 AI 底层认知之争
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
王子健
社区首页
>
专栏
>
从“词元”到“符元”:Token 中文名背后的 AI 底层认知之争
从“词元”到“符元”:Token 中文名背后的 AI 底层认知之争
王子健
关注
发布于 2026-04-09 21:29:16
发布于 2026-04-09 21:29:16
191
0
举报
概述
在“Token”被定名为“词元”之后,本文从计算本体、多模态演进与回译一致性等角度指出,该命名存在路径依赖与语义锚定问题。Token本质是跨模态的离散符号单元,而非语言“词”。相比之下,“符元”更能对齐计算本质,具备长期稳定性与认知一致性。
文章被收录于专栏:
人工智能
人工智能
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
人工智能
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
人工智能
#Token
#词元
#符元
#Token中文名
#AI
评论
作者已关闭评论
0 条评论
热度
最新
推荐阅读
目录
一、定义的错位:不能用“起源”替代“本质”
二、类比的边界:解释一旦变成定义就会开始偏离
三、认知的代价:当语义锚点制造系统性误解
四、单义性的幻觉:当一个词试图承载两个体系
五、本体的回归:Token本质上是“符号”,而非“词”
六、语言的断裂:回译机制中的映射失效
七、统一的误区:形式一致不等于结构一致
结语
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
0
0
推荐