首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >女朋友问我大模型参数究竟是个什么东西?

女朋友问我大模型参数究竟是个什么东西?

作者头像
不惑
修改2025-03-12 10:09:54
修改2025-03-12 10:09:54
6331
举报
概述
最近DeepSeek很火,老婆问我:“大模型的参数到底是什么东西?”我:所谓参数,参数,参天之数。其实参数本身就是一个数值,可能其中一个是3.123456789,另一个是-0.0009527。以DeepSpeed-R1最大版本为例,它有671B个参数(B代表十亿)。你可以把这些参数想象成一张巨大的网格,每个网格中都存储着一个数值。一个大模型通常包含几千亿个参数,这些参数占据了模型体积的90%以上。
文章被收录于专栏:从0开始学Go从0开始学Go

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 那么,大模型是怎么回事?
  • 参数是咋来的?
  • 为什么需要这么多参数?
  • 大模型的核心思想
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档