腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(171)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
Xcode Apple启用
avx512
在Xcode(版本10.1 (10B61))中,我使用宏来检测
AVX512
支持,如下所示。#ifdef __AVX__#endif #error "avx2"#error "
avx512
如何启用
avx512
并检测它?似乎没有几个宏可以检测到
avx512
。
浏览 0
提问于2019-03-27
得票数 1
回答已采纳
1
回答
禁用所有
AVX512
扩展
我需要禁用gcc编译代码中的所有
AVX512
扩展。究其原因,是因为瓦兰因
AVX512
指令而窒息。有办法用一个旗子来做吗?
浏览 1
修改于2020-03-24
得票数 5
回答已采纳
1
回答
AVX512
非法指令
在我的中,我解释说我从AVX开始是为了加速我的代码(请注意,尽管这篇文章有一些共同之处,但据我所知,这篇文章引用了
AVX512
和之前的AVX2,它们略有不同,需要不同的编译标志)。在尝试使用AVX2之后,我决定尝试使用
AVX512
,并更改了我的AVX2函数: void getDataAVX2(u_char* data, size_t cols, std::vector<double
浏览 40
修改于2018-08-14
得票数 0
回答已采纳
1
回答
AVX512
和MSVC预处理符号
根据这个链接,
AVX512
( )没有预定义的预处理器符号。 我正试图在(你猜到的)窗口上建立一个使用本机库的雷暴系统。本征和雷声on都使用cmake和depinding的编译器预存符号,特征用
avx512
指令编译或不编译。使用/arch:
AVX512
似乎不会在MSVC中触发任何错误,但不会定义特征所需的__AVX512F__符号。我还试图在cmake参数中包括-D__AVX512F__=ON,但仍然没有成功。由于
AVX512
没有预定义的预定义处理器符号,是否有任何方法强制Eigen使用
avx512</
浏览 1
修改于2019-02-15
得票数 2
1
回答
AVX512
中的人口计数
我一直试图在一台支持_mm256_popcnt_epi64的机器上使用
AVX512
,并在以前为AVX2进行优化的代码上使用。 不幸的是,我遇到了找不到函数的问题。
浏览 4
修改于2020-05-18
得票数 2
回答已采纳
2
回答
为什么VS C/C++
AVX512
编译软件可以在我的系统上运行,而我的CPU没有
AVX512
?
我最近看到Visual Studio2019预览版增加了一个用
AVX512
编译的选项。好的,我试过了,它起作用了。但是为什么它能工作,而我的CPU没有这样的能力呢?我正在使用下面的C/C++脚本来检测CPU功能: 运行此脚本时,所有
AVX512
标志(AVX512F、AVX512CD、AVX512PF和AVX512ER)在我的系统上都不可用。Visual Studio 2019预览版有以下选项: AVX、AVX2、
AVX512
、SSE和SSE2。正如您现在所理解的,唯一的问题似乎是
AVX512
功能。它可以在我的PC
浏览 49
修改于2019-11-06
得票数 0
1
回答
AVX512
比较和交换
在
AVX512
集合中是否有原子CAS指令或等效指令? 我不能立即找到一个,但也没有最好的谷歌福。
浏览 12
修改于2018-01-04
得票数 2
回答已采纳
1
回答
AVX2和
AVX512
的加速
我正在尝试可视化将AVX2和
AVX512
合并的加速过程。_mm512_store_si512((__m512i *)&G[i],C_512_VEC); time = omp_get_wtime() - time;我已经检查了单独的加载、添加、存储操作。
AVX512
的存储操作
浏览 2
修改于2020-02-05
得票数 0
回答已采纳
1
回答
防止immintrin.h在不支持
avx512
的情况下编译时包含
avx512
头
我在没有
AVX512
支持的情况下编译,但是我注意到immintrin.h拖着吨的loforAVX512。34365 34257我试着找gcc的行军牌,找不到,如果有人知道更合适的标签旁边,请评论。
浏览 13
提问于2022-12-04
得票数 0
1
回答
AVX512
未在英特尔Tensorflow上显示
我有一个Windows 11计算机与第11代英特尔核心i7-1185G7,它支持SSE4.1,SSE4.2,AVX,AVX2和
AVX512
。这台电脑没有GPU。它提到在PIP车轮上自动使用和启用
AVX512
: 如何检查TensorFlow是否确实在使用
AVX512
?如果TensorFl
浏览 21
提问于2022-07-19
得票数 1
1
回答
AVX512
与矢量相比不掩模
在
avx512
中完成相同事情的最有效方法是什么?它是_mm512_cmp_ps_mask后面的一个扩展吗?
浏览 4
提问于2021-07-09
得票数 3
回答已采纳
1
回答
非对齐向量指针奇数(
AVX512
)
我的问题是导出指向包含浮点数的内存空间的未对齐__m512指针。我发现GCC和Clang在通过这种装置访问内存时,在生成正确的uop (未对齐或对齐)方面有些不稳定。typedef float MyFloatVector __attribute__((vector_size(64), aligned(4)));Something(*vec_ptr); Clang和GCC都为上面的内容生成MOVUPS。但是,如果将vec_p
浏览 0
提问于2020-06-03
得票数 1
1
回答
本征_mm512_round_ps缺失于
AVX512
我缺少了
AVX512
的内部
AVX512
(它只适用于KNC)。知道为什么没有这个吗? 将_mm256_round_ps应用于上、下半部分,并将结果融合?
浏览 0
提问于2018-06-14
得票数 2
回答已采纳
1
回答
如何让
AVX512
进入C#?
public S64 M5; public S64 M7; void return;还更新了
AVX512
类:{ [DllImport("libavx512.dll
浏览 1
修改于2021-04-24
得票数 2
回答已采纳
2
回答
用
AVX512
制作掩模的BMI
我受到这个链接的启发,研究了
AVX512
的性能。我的想法是,循环后的清理循环可以使用
AVX512
掩码操作删除。我已经用
AVX512
的结果扩展了链接中的表。ISA | MIPS-32 | AVX2 | RV32V |
AVX512
| ******************************|***我这样做是为了SSE2 (实际上是带FMA的AVX2,但有128位向量),AVX2和
AVX512
用于三种不同的循环。SSE 2*1000/
浏览 1
修改于2020-02-09
得票数 6
回答已采纳
1
回答
在
AVX512
中乘以不同的类型
但是,我在
avx512
中找不到任何将双精度与整数相乘的内部函数。当我在__m512i上使用_mm512_castsi512_pd内部函数时,我得到了一个错误的值,所以我猜这个内部函数也没有多大帮助。
浏览 42
提问于2020-11-29
得票数 1
回答已采纳
1
回答
任意步长的
avx512
步长聚类
我知道在
AVX512
中,你可以跨出1,2,4,8步长,但是如果我有一个任意的步幅,可以在10-1000之间?在编译时就知道了步幅。我明白了,指令不会成为瓶颈,内存可能会成为瓶颈。
浏览 0
提问于2021-07-13
得票数 0
回答已采纳
1
回答
有办法用
avx512
自动替换为avx2吗?
根据Linus的建议(以及跨平台性能),我希望不使用
avx512
。我是否可以向编译器( gcc和msvc)指定一个标志,以便如果我正在使用的库试图从内部优化或编译器优化中使用
avx512
,那么所有avx2指令都会被拆分成成对的avx2指令吗?
浏览 5
提问于2021-03-20
得票数 0
回答已采纳
1
回答
GCC有没有内置的
AVX512
操作?
我希望找到像这样的函数在最近的一次GCC启用512位
AVX512
寄存器的使用方式中,可以使用256位的AVX2寄存器,但根据手册,它们在GCC 9.2
浏览 88
提问于2019-12-01
得票数 3
回答已采纳
1
回答
在AVX2或
AVX512
中使用PyOpenCL编写内核函数?
根据我的CPU的系列类型(如果是AVX2或
AVX512
),我是否被限制只能使用AVX2或
AVX512
?我知道AVX2是256位指令,而
AVX512
是512位指令,所以当我写内核函数时,我应该只使用double4变量来实现AVX2风格的指令吗?反之亦然,AVX-512风格的double8变量?
浏览 1
提问于2019-12-04
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
点击加载更多
领券