不惑
女朋友问我大模型参数究竟是个什么东西?
原创
关注作者
腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
不惑
社区首页
>
专栏
>
女朋友问我大模型参数究竟是个什么东西?
女朋友问我大模型参数究竟是个什么东西?
不惑
关注
修改于 2025-03-12 10:09:54
修改于 2025-03-12 10:09:54
633
1
举报
概述
最近DeepSeek很火,老婆问我:“大模型的参数到底是什么东西?”我:所谓参数,参数,参天之数。其实参数本身就是一个数值,可能其中一个是3.123456789,另一个是-0.0009527。以DeepSpeed-R1最大版本为例,它有671B个参数(B代表十亿)。你可以把这些参数想象成一张巨大的网格,每个网格中都存储着一个数值。一个大模型通常包含几千亿个参数,这些参数占据了模型体积的90%以上。
文章被收录于专栏:
从0开始学Go
从0开始学Go
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
腾讯技术创作特训营S12#AI进化论
论文共读
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系
cloudcommunity@tencent.com
删除。
腾讯技术创作特训营S12#AI进化论
论文共读
#论文共读
评论
登录
后参与评论
0 条评论
热度
最新
推荐阅读
目录
那么,大模型是怎么回事?
参数是咋来的?
为什么需要这么多参数?
大模型的核心思想
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
0
1
0
推荐