首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在PyTorch中计算大型神经网络的Hessian值?

如何在PyTorch中计算大型神经网络的Hessian值?
EN

Stack Overflow用户
提问于 2022-03-14 16:50:50
回答 1查看 599关注 0票数 2

如何在PyTorch中计算大型神经网络或变压器模型的Hessian矩阵?我知道torch.autograd.functional.hessian,但它似乎只计算函数的Hessian,而不是神经网络。我也在How to compute hessian matrix for all parameters in a network in pytorch?中看到了答案。问题是,我想计算关于权值的Hessian函数,但是对于大型神经网络来说,把它写成权值的函数是非常低效的。有更好的方法吗?如有任何建议,将不胜感激。谢谢。

EN

回答 1

Stack Overflow用户

发布于 2022-03-16 01:08:04

过了一段时间,我终于找到了一个解决这个问题的新特性详细信息将在以下评论中描述:https://github.com/pytorch/pytorch/issues/49171#issuecomment-933814662。该解决方案使用函数torch.autograd.functional.hessian和新特性torch.nn.utils._stateless。注意,要使用这个新特性,您必须安装pytorch的夜间版本。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71471406

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档