文章/答案/技术大牛

发布

社区首页 >问答首页 >如何用模型参数的数量来计算所需的标度？

问如何用模型参数的数量来计算所需的标度？
EN

Data Science用户

提问于 2022-06-28 06:48:23

回答 1查看 48关注 0票数 1

GPT-3有1,750亿个参数，需要使用~3.114 * 10^{23}触发器，在10K特斯拉V100 GPT上训练大约需要一个月。人们普遍认为，大脑的参数相当于100万亿左右。我想知道训练这样大小的变压器需要什么样的计算量。难道这仅仅是~10^3倍的失败吗？

一般来说，如何计算变压器、神经网络、CNN和其他流行的深度学习模型的模型参数所需的尺度？

gpu

gpt

scalability

deep-learning

transformer

回答 1

Data Science用户

发布于 2022-06-28 07:24:15

最近使用像兰卜达这样的变压器的模型有不到100万亿的参数，而且它的回答比大多数人要好得多(如果不是全部的话，因为它有大量的知识)。

我的意思是，人脑和人工大脑是不可比拟的，但这并不意味着在一个人工大脑中有100万亿个参数就相当于人类大脑。

那么，参数和触发器之间的相关性确实是相当线性的。我在一篇文章中创建了一个表格，以粗略估计数量级，因为关于这个主题的信息很少。

来源：https://medium.com/p/1cd2225fd0f2

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/112189

复制

相似问题

问如何用模型参数的数量来计算所需的标度？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何用模型参数的数量来计算所需的标度？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何用模型参数的数量来计算所需的标度？
EN