首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Xeon Phi协处理器还是Xeon Phi主机处理器?

Xeon Phi协处理器还是Xeon Phi主机处理器?
EN

Stack Overflow用户
提问于 2015-10-28 03:23:17
回答 2查看 1.3K关注 0票数 5

主机处理器和协处理器之间有什么区别?特别是Xeon Phi协处理器和Xeon Phi主机处理器?

我在这些机器上有一些性能结果(并行化的OpenMP扩散方程代码正在运行),这表明当相同数量的线程工作时,主机处理器的工作速度要快得多。我想知道不同之处,并将它们与我的结果联系起来。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-10-28 16:09:47

为了重新迭代Jeff在评论中说的话,您有一个带有附加Xeon协处理器的Xeon主机。目前一代的Xeon Phi (骑士角)只能作为协处理器使用,而不是作为独立的Xeon Phi主机(这应该是下一代的Knight's Landing)。

当您运行您的程序而不从您的主机Xeon卸载,从本网站,它看起来您将能够运行多达16个线程。请注意,每个核心的速度约为2.2GHz。

当您在Xeon协处理器上以本机执行模式运行您的程序时,您应该能够使用更多的线程运行。要使用的最佳线程数取决于您拥有的Xeon Phi模型 (一些线程最好使用56个线程,另一些线程使用60个线程)。但是请注意,每个Xeon核心(大约1.2 GHz)明显弱于单个Xeon核心(大约2.2 GHz)。多核Xeon技术的好处就是:您可以运行多个内核。

最后一个非常重要的考虑是,Xeon有一个512位宽的SIMD指令集。因此,您可以比在主机上更好地支持运行在Xeon协处理器上的SIMD矢量化。在你的例子中,我相信你的Xeon主机只有一个256位的SIMD矢量处理单元.因此,如果还没有,则可以利用SIMD矢量化提高Xeon上的性能(如果您处理的是单精度的话,可以提高到x16 )。您的Xeon主机只会放弃x8性能。仅仅为了让您在google上开始,OpenMP 4.0允许您编写类似#pragma omp simd的东西,以便告诉编译器什么时候在代码中向量化低级别循环。如果您真的想从Xeon获得最大的性能,那么添加SIMD矢量化是必要的。

因此,要直接回答您的问题:使用相同数量的核比较Xeon主机和Xeon协处理器之间的性能结果是无用的。我们已经知道每个Xeon Phi核比每个Xeon核慢。您应该使用每个核允许的最大数目(分别为60和16个)比较结果,如果您想要直接比较的话,应该最大限度地利用向量处理单元。

票数 5
EN

Stack Overflow用户

发布于 2015-10-28 16:09:39

如果您讨论的是当前代(KNC)而不是下一代(KNL),则定义如下。

主机处理器:托管协处理器的~8内核/ ~16线程Xeon,即协处理器通过PCIe总线连接的Xeon主机。

协处理器:在Xeon的PCIe总线上挂在Xeon主机上的~60核/~240线程协处理器。

主机使用卸载指令或使用一些分布式编程范式(如MPI )本地运行,将高度并行/向量化的作业分批给协处理器。

至于对下一代主机处理器的评论,评论指的是下一代Xeon (KNL)可以配置为挂在PCIe总线上的协处理器(如第一代Xeon,KNC),也可以配置为插入主板的普通处理器。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33382371

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档