腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(24)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
NSIGHT计算: SOL SM对
Roofline
我还在80+%上看到了ALU管道的使用情况 我的代码工作在半精度浮动,使
Roofline
图表不适用于我的代码,我怀疑。
浏览 1
修改于2021-03-10
得票数 1
1
回答
Roofline
模型:计算操作强度
假设我有一个这样的玩具圈float y[N]; y[i] = a*(x[i-1] - x[i] + x[i+1]) OI =3触发器/(2*4字节)float x[N]; for (int i
浏览 2
修改于2020-08-25
得票数 8
回答已采纳
1
回答
在构建
Roofline
工具时,我会得到一个IOException。为什么?
目前,我在试图运行
roofline
时遇到了以下错误。如果你们能帮我在我的新环境下启动和运行它,那就太好了?bravegag@bravegag-MacBookPro:/opt/
roofline
/tool$ ./gradlew如何出错:无法打开任务工件状态缓存(/opt/
roofline
/tool/.gradle/1.0-milestone-8/taskArtifacts). java.io.IOException
浏览 4
提问于2012-04-28
得票数 1
回答已采纳
1
回答
一个点在
Roofline
模型的区域之外。
我使用
roofline
模型进行代码优化分析。我不明白为什么绿点不在红色区域。
浏览 3
修改于2022-10-27
得票数 1
1
回答
Roofline
模型-如何计算触发器/字节比?
我想要创建
roofline
模型,我有问题的算法触发器每字节的比率。你能解释一下怎么算吗?该算法使用五点模板进行计算.
浏览 8
修改于2020-08-29
得票数 2
回答已采纳
1
回答
Roofline
模型:如何增加算术强度,以便提高性能?
对于
roofline
图中内存绑定区域中的算法,建议增加算术强度,使它们向右移动(计算界区域),从而为提高性能提供空间,因为性能屋顶会更高。 我不明白如何增加算术强度(比如说,增加no )。
浏览 6
提问于2022-03-06
得票数 0
回答已采纳
1
回答
如何有效地用条件矢量化多项式计算(
roofline
模型)
我想把一个小次多项式(2-5)应用到一个长度可以在50到3000之间的向量上,并尽可能有效地这样做。例如:我们可以取函数:(1+x^2)^3,当x>3时,0当x<=3时,这样的函数将对双元素的向量执行100 k次。每个向量的大小可以是50到3000之间的任何东西。在GCC 9和GCC 10的尝试中,我发现这个循环没有被矢量化。我手动地将它矢量化,结果发现增益比我预期的要小得多(1.5倍)。我还用逻辑
浏览 7
提问于2020-08-14
得票数 0
回答已采纳
3
回答
联系人表单7复选框样式
sans-serif;} #doors:checked~label[for="doors"],#conservatories:checked~label[for="conservatories"], <input ty
浏览 5
修改于2018-04-24
得票数 0
1
回答
为什么计算吞吐量的值与实际性能/峰值性能不同?
目标-处理所有设置的
roofline
mpirun -n 1./run_pselinv_linux_ -H _v2.0-H H3600.csc -file ./tmpfile
roofline
set收集足够的数据来构建
roofline
模型。但我不清楚每个指标的含义。
浏览 16
修改于2022-09-13
得票数 0
回答已采纳
2
回答
无法让GSAP MorphSVG正常工作
"plainLine" class="st0" points="298,279 387.5,279 469.2,279 596,279"> </polyline></svg>TweenLite.to("#plainLine&quo
浏览 5
提问于2015-11-26
得票数 0
2
回答
Plots.jl:将对数刻度刻度的刻度更改为正常格式
.^ radix_range_xticksbw = 25.0ys =
roofline
.
浏览 9
修改于2022-04-20
得票数 2
回答已采纳
1
回答
很低的触发器/秒,没有任何数据传输
$ perf stat -e all_dc_accesses -e fp_ret_sse_avx_ops.all cmake-build-release/
roofline
_prediction在8.83秒内以240.002.400.000次失败,该机器仅获得27.1个GFLOPs&
浏览 6
修改于2021-10-24
得票数 1
5
回答
SVG中文本元素的垂直对齐方式
实际上,我希望我的定位是根据
roofline
而不是baseline!
浏览 3
提问于2012-09-03
得票数 154
回答已采纳
1
回答
屋顶模型中的带宽上限问题
我不太理解描述的
roofline
模型中的带宽因素(如下面所示的图片及其说明): 为什么βx i和轴之间的交点可以改变?为什么在操作强度为零的情况下会出现性能?
浏览 5
修改于2022-08-29
得票数 0
回答已采纳
1
回答
报告失败与英特尔顾问XE
我在Linux CentOS 7.4上设计了2018年英特尔顾问(build 523188)来描述一组基准测试(我想把它们都绘制在一个单独的
Roofline
图中),我正在使用命令行工具advixe来收集每个基准的调查
浏览 7
修改于2020-08-29
得票数 1
回答已采纳
1
回答
Trsm和其他BLAS操作的时间复杂度是多少?
我希望得到模型的时间复杂度或失败值,以评估其在
roofline
模型中的性能。 该模型有两种操作:Gemm和Trsm。
浏览 5
修改于2022-09-07
得票数 0
回答已采纳
1
回答
车顶模型的优化方法
关于
roofline
模型,我有一些关于如何处理内存绑定点的问题。1)如果从I0导出的I0.BW=Peak为1.21,而实际I1为0.71,是否意味着实际I1处于内存绑定状态?
浏览 6
修改于2022-10-09
得票数 1
回答已采纳
1
回答
连接URL和抓取数据时出现问题
page.text, 'html.parser') team_name_list = soup.find_all('h4',class_='d3-o-media-object__
roofline
浏览 3
修改于2020-08-14
得票数 0
2
回答
将默认的旧boost 1.46替换为1.50
和内核版本3.0.0-23-通用和+/-默认情况下,我得到了以下1.46.1版本的Boost,它安装在/usr/include/boost和/usr/lib下 bravegag@Zeus:~/code/
roofline
浏览 1
修改于2012-08-26
得票数 3
回答已采纳
2
回答
如何停止:悬停并在导航子菜单上设置onClick
/">Doors</a> <li class="nav-item"><a href="/">
Roofline
浏览 2
提问于2022-10-10
得票数 1
第 2 页
领券