windyrobin

文章/答案/技术大牛

发布

LV0

关注了用户 2026-03-172026-03-17 11:54:56

未闻花名

深耕青少年心理和医疗大健康领域，融合AI大模型的本地化应用，对大模型有深度的应用经验和使用体验。

189 文章0 回答79 关注者

发表了文章 2026-03-122026-03-12 07:45:08

[论文速递]QV maybe enough in LLM: MQA/GQA/MLA 的统一解释

本文从常识出发、从自然语言的词性分析/句式分析的视角，深度探讨、推导得到Transformer 模型中 QKV 机制的本质，并据此给出目前流行的MQA/GQA/...

windyrobin 2026-03-122026-03-12 07:45:08

LLM、第四期热点征文-大模型技术、人工智能

关注了用户 2026-02-282026-02-28 10:47:55

mathor

447 文章1 回答93 关注者

发表了文章 2026-02-272026-02-27 09:18:33

[论文速递] LLM/Attention的引力场是存在的

人们一直惊叹于LLM/Transformer 的强大能力，但对它的核心能力-Attention 的内部原理/本质了解甚少或选择性忽略；

windyrobin 2026-03-062026-03-06 21:23:08

LLM

关注了用户 2026-02-262026-02-26 17:18:12

小陡坡香菜

22 文章0 回答29 关注者

订阅了专栏 2026-01-292026-01-29 15:07:38

LLM - 可解释性

专注 LLM 可解释性

2 文章1 订阅数

加入了专栏 2026-01-292026-01-29 15:07:38

LLM - 可解释性

专注 LLM 可解释性

2 文章1 订阅数

创建了专栏 2026-01-292026-01-29 15:07:38

LLM - 可解释性

专注 LLM 可解释性

2 文章1 订阅数

个人简介

暂未填写公司和职称
练气小菜鸟
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
上海
加入社区时间：2026-01-13

个人成就

获得 1 次赞同
文章被阅读 470 次

关注了：3关注者：0

windyrobin

未闻花名

[论文速递]QV maybe enough in LLM: MQA/GQA/MLA 的统一解释

mathor

[论文速递] LLM/Attention的引力场是存在的

小陡坡香菜

LLM - 可解释性

LLM - 可解释性

LLM - 可解释性

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐