首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >x264库速度- Altivec对SSE4 -

x264库速度- Altivec对SSE4 -
EN

Stack Overflow用户
提问于 2013-02-25 16:39:13
回答 1查看 2.2K关注 0票数 1

我有简单的廉价双核心英特尔-3和访问超级昂贵的powerPc7-Aix。

在进行了几天的strugle之后,我编写了libx264并在两台计算机上进行了测试:

  1. GCC:英特尔上的库x264 (具有SSE2功能)和
  2. GCC在16核心powerPc (与海拔)。

..。其结果是廉价的英特尔是x2倍更快!(由于停课,英特尔的速度是以前的10倍)

我的问题是:这正常吗?其他的powerPC用户都有相同的结果吗?. Can =‘Can 2’> x264库的优化工作是否与英特尔以相同的速度工作?或者MMX/SSE优化的速度至少是这个库的2倍?

我对多线程选项不感兴趣。核心和线程的数量是无关的。只是简单的单线程x264编码,默认的“媒体预置”使用rawvideo作为源,SSEvs.TOVEC。

也许本机Aix编译器提供了更好的结果?(我只设法让gcc工作)

..。mac用户可能对此有所了解。

代码语言:javascript
复制
powrPc7-Aix:$ time (cat raw10sec.y4m |x264 --input-res 720x576 --fps 50 -o /dev/null -)
x264: 64-bit XCOFF
x264 [info]: using cpu capabilities: Altivec
time: real 0m33.559s
---
intelDebian:$ time (cat raw10sec.y4m |x264 --input-res 720x576 --fps 50 -o /dev/null -)
x264: ELF 32-bit LSB executable
x264 [info]: using cpu capabilities: MMX2 SSE2Fast SSSE3 FastShuffle SSE4.1 Cache64
time: real 0m16.503s
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-03-03 20:13:37

有几件事在脑海中浮现:

  • GCC在优化x86 (特别是商品英特尔/AMD部件)方面的努力可能比其他架构(可能是所有其他架构的总和)要大得多。
  • 同样,x264在优化x86/SSE方面也付出了更多的努力。
  • 您的问题是SSE2,但x264说它使用SSE4.1。有很大的不同!
  • MMX/SSE最初的目标是英特尔认为重要的东西,有许多专门的指令和怪癖(例如,浮点数和整数加载有不同的指令,尽管它们将相同的内存加载到“相同”寄存器中)。AltiVec看起来更加正交,但其结果是,MMX在设计中所擅长的东西可能不太好。
  • 即使假设AltiVec/SSE在很大程度上是等价的,您也没有提到时钟速度和每时钟指令。
  • PPC部分是昂贵的,因为您要为16×4线程付费--尽可能多地将其打包到服务器/HPC应用程序的单个芯片上并不少见。商品零件的收集往往更快、更便宜(有时甚至计算终生电费),这有点令人尴尬,但事情就是这样发展的。

一个更有趣的比较将是与PS3的代码进行优化,以充分利用所有的内核--显然,PS3s在强制加密方面非常出色。可悲的是,他们已经停止了他们的生产,我不知道这几天在Linux上运行有多容易。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15071821

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档