首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >从 26 个字母到 50000 个 Token:现代 LLM 的语言密码

从 26 个字母到 50000 个 Token:现代 LLM 的语言密码

作者头像
ETL 小当家
发布2026-02-23 00:56:45
发布2026-02-23 00:56:45
3850
举报
概述
当你和ChatGPT聊天时,无论你输入"你好"还是"Hello",背后都在发生一件事:你的文字被切成了一个个叫做"Token"的小单位。 可以把Token想象成**语言的乐高积木**。就像用乐高积木拼出各种造型,LLM用Token拼出所有的文字。但这里有个重要的认知:**Token ≠ 单词,也 ≠ 字**。
文章被收录于专栏:人工智能人工智能

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档