腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(1981)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
gdb反向调试
avx2
所以我有了一个支持
avx2
指令集的新的高级cpu。这很好,但会破坏gdb的反向调试。在没有优化的情况下编译时,代码仍然使用共享库,例如调用memset(),然后调用memset的
avx2
优化版本。这很好,但是gdb记录不支持
avx2
。0xc5是这里的vex前缀。 反向调试在不支持
avx2
的cpu上工作得很好。我如何使libc等不使用
avx2
优化版本的库调用,以便我可以使用gdb记录,后退等等?
浏览 8
提问于2017-05-03
得票数 6
回答已采纳
3
回答
/arch:AVX启用
AVX2
吗?
/arch:AVX是否在VisualStudio2012Update 4上启用了
AVX2
(带有256位整数SIMD指令和一些新的FP改组)?思想路线: (沙桥对哈斯韦尔,或挖掘机/禅宗对推土机),
浏览 5
修改于2021-12-16
得票数 8
回答已采纳
2
回答
编译
AVX2
程序
Ubuntu12.4LTS和GCC 4.6与以下编译行: g++ -g -Wall -mavx ProgramName.cc -o ProgramName目前,更新的gcc版本可以正确编译AVX和
AVX2
程序。然而,当我运行程序时,它给了我以下错误:非法指令(核心转储),尽管它是在gcc 4.6上运行的 我的问题是:编译和运行AVX和
AVX2
内部函数的最佳方法是什么?
浏览 4
提问于2014-12-24
得票数 5
1
回答
AVX2
稀疏矩阵乘法
我试图利用新的
AVX2
集合指令来加速稀疏矩阵向量乘法。矩阵采用CSR (或Yale)格式,有一个行指针,它指向列索引数组,该数组又保存这些列。) { }} 现在,我的目标是用
AVX2
我检查了反汇编,对于上面的版本,只生成了FP指令,对于我的
AVX2
代码,所有的
AVX2
操作都如预期的那样出现。即使有适合缓存的小矩阵,
AVX2
版本也是不好的。我
浏览 3
提问于2015-07-15
得票数 6
回答已采纳
1
回答
AVX2
的装配误差
我已经确认我的CPU支持
AVX2
指令。那么谁能帮我找出错误呢?
浏览 7
修改于2014-03-11
得票数 1
回答已采纳
1
回答
AVX2
置换控制位
AVX2
指令中的permute命令需要imm8类型的参数。此参数控制如何执行排列。不幸的是,我不明白这个imm8参数是如何“创建”的。我必须设置什么值,或者我如何确定必须为特定的永久设置什么值?
浏览 13
修改于2018-12-22
得票数 1
回答已采纳
1
回答
AVX与
AVX2
的差异
下面是
AVX2
中矩阵乘法的实现。我使用的机器只支持AVX,所以我尝试用AVX实现相同的配置。这是指向AVX和
AVX2
的所有命令的链接。 谢谢您的任何洞察力!
浏览 5
修改于2021-07-11
得票数 2
回答已采纳
1
回答
用
AVX2
广播高音
vpbroadcastw指令在
AVX2
中方便地引入(?)在32字节ymm寄存器中向所有位置广播低16位字. 因为我是逆反派,所以我想将
AVX2
寄存器的高字(位255:240)广播到所有元素。
浏览 0
提问于2019-08-15
得票数 3
1
回答
AVX2
SIMD加法不工作
我试图添加这两个向量使用
AVX2
SIMD指令。无论在主方法中初始化的数组有多大,都应该用
AVX2
打印SIMD加法的结果。
浏览 4
修改于2016-12-10
得票数 0
回答已采纳
1
回答
AVX2
中的位不/补
在
AVX2
中,按位的NOT/补码似乎没有内在的特性。我错过了吗,还是我们应该做一些像_mm256_xor_si256(a, _mm256_set1_epi64x(-1LL))这样的事情?
浏览 7
修改于2017-09-18
得票数 3
回答已采纳
1
回答
基于
AVX2
的256位CRC计算
unsigned __int64 _mm_crc32_u64 (unsigned __int64 crc, unsigned __int64 v) 但是,我无法在
AVX2
内部找到256位版本的CRC计算如何使用英特尔
AVX2
进行此操作?
浏览 2
修改于2017-04-11
得票数 0
回答已采纳
2
回答
如何在Delphi中检测
AVX2
?
如果CPU有AVX1或
AVX2
,下面的代码返回True。有人知道如何修改这段代码来准确检测
AVX2
指令支持吗?
浏览 0
修改于2017-01-05
得票数 2
1
回答
std::clamp的
AVX2
等效项
假设精度p介于1和16之间,我想在-p/2和p/2之间钳位一个
AVX2
整数寄存器。我目前在非
AVX2
整数上使用std::clamp做这件事。 有没有办法用
AVX2
做到这一点?
浏览 14
修改于2020-09-17
得票数 2
回答已采纳
1
回答
AVX2
和AVX-512有什么不同?
在单指令多路复用和并行化方面,
AVX2
和AVX512有什么不同?它们是相同的还是不同的?我刚刚看到AVX512中使用了double8,而
AVX2
使用了double4?
浏览 21
修改于2020-04-24
得票数 2
1
回答
为测试目的在CPU中禁用
AVX2
我有一个要求
AVX2
正确工作的应用程序。实现了一个检查,以检查应用程序启动期间是否有
AVX2
指令。我想检查它是否正确工作,但我只有有
AVX2
的CPU。为了测试目的,有没有办法暂时关闭它?
浏览 0
修改于2019-04-19
得票数 13
回答已采纳
1
回答
使用
AVX2
快速查找表
我想用SSE2或
AVX2
。我试过使用_mm256_i32gather_epi32命令,但速度慢了31%。有没有人对任何改进或不同的方法有任何建议?Broadwell and 5 for Skylake) if (sizeof(T) == sizeof(int16_t)) { avx1 = _mm256_loadu_si256((__m256i *)(lut + 8));
浏览 3
修改于2016-03-04
得票数 7
回答已采纳
1
回答
英特尔
AVX2
组件开发
为了优化,我使用了
AVX2
指令集。:IDE:- MSVS 2008(教授)汇编程序:- YASM 我想知道有没有模拟器可以在不升级硬件的情况下运行和调试我的
AVX2
浏览 1
提问于2014-03-25
得票数 3
1
回答
用SSE2和
AVX2
编译库
使用VS2015并编译一个具有SSE2指令和
AVX2
指令的库(只有在CPU中检测到时才使用),如果我用/arch:
AVX2
编译库,但只调用SSE2指令,则会得到“非法指令”(在_mm_set1_epi32这是lib:,还有一个问题,,虽然我不认为它与
AVX2
打开并调用SSE2指令直接相关。
浏览 0
修改于2018-10-10
得票数 2
回答已采纳
2
回答
AVX2
中的条件指令
您能给出
AVX2
中可用的条件指令列表吗?到目前为止,我发现了以下几点: 有条件乘法和条件加法之类的吗?
浏览 0
修改于2017-08-23
得票数 1
回答已采纳
1
回答
AVX2
移位(16位)整数
在
AVX2
中是否有对(16位)整数元素执行右移和左移操作的内置指令?
浏览 0
修改于2017-04-12
得票数 1
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券