我一直在使用Repa库开发一个路径跟踪器。我最近通过使用一元computeP对其进行了重构,以并行化。然而,我发现性能提升可以忽略不计。此外,在监控htop时,程序似乎仍然只使用了一个CPU。为了深入了解这个问题,我打开ghci并运行以下命令:
~
❯ stack ghci --package repa
Configuring GHCi with the following packages:
GHCi, version 8.0.2: http://www.haskell.org/ghc/ :? for help
Loaded GHCi configuration from /tmp/ghci12667/ghci-script
Prelude> import Data.Array.Repa
Prelude Data.Array.Repa> import System.Random
Prelude Data.Array.Repa System.Random> randomList = randoms (mkStdGen 0)
Prelude Data.Array.Repa System.Random> shape = (Z :. 1000000)
Prelude Data.Array.Repa System.Random> array = fromFunction shape $ \(Z :. i) -> randomList !! i
Prelude Data.Array.Repa System.Random> sumP array没有骰子。根据htop的指示,repa似乎仍然只使用一个CPU核心

此外,执行团队在sumP和sumS之间几乎没有区别,稍微偏向于sumS
Prelude Data.Array.Repa System.Random> array = fromListUnboxed (Z :. 1000000) $ take 1000000 $ randoms (mkStdGen 0)
(0.01 secs, 0 bytes)
Prelude Data.Array.Repa System.Random> sumP array
AUnboxed Z [500140.92257232184]
(0.99 secs, 1,916,158,952 bytes)
Prelude Data.Array.Repa System.Random> sumS array
AUnboxed Z [500140.92257232184]
(0.93 secs, 2,348,156,248 bytes)我遗漏了什么?如果重要的话,我使用的是Arch Linux:
~
❯ uname -a
Linux roskolnikov 4.11.9-1-ARCH #1 SMP PREEMPT Wed Jul 5 18:23:08 CEST 2017 x86_64 GNU/Linux更新
一些评论指出,我应该像repa文档中指出的那样,对ghci使用-threaded选项。我的印象是(错误的?) ghci默认使用-threaded。在任何情况下,我的程序都已经在使用这些标志--这是来自.cabal文件的代码片段:
executable write
hs-source-dirs: app
main-is: Write.hs
ghc-options: -Odph
-rtsopts
-threaded
-fno-liberate-case
-funfolding-use-threshold1000
-funfolding-keeness-factor1000
-fllvm
-optlo-O3
build-depends: base
, pathtracer
, repa
, JuicyPixels
default-language: Haskell2010此外,我使用(我认为)正确的ghci选项重新运行了ghci中的命令:
~
❯ stack ghci\
--package repa\
--ghc-options -Odph\
--ghc-options -rtsopts\
--ghc-options -with-rtsopts=-N\
--ghc-options -threaded\
--ghc-options -fno-liberate-case\
--ghc-options -funfolding-use-threshold1000\
--ghc-options -funfolding-keeness-factor1000\
--ghc-options -fllvm\
--ghc-options -optlo-O3
Configuring GHCi with the following packages:
when making flags consistent: warning:
-O conflicts with --interactive; -O ignored.
GHCi, version 8.0.2: http://www.haskell.org/ghc/ :? for help
Loaded GHCi configuration from /tmp/ghci31252/ghci-script
Prelude> import Data.Array.Repa
Prelude Data.Array.Repa> import System.Random
Prelude Data.Array.Repa System.Random> randomList = randoms (mkStdGen 0)
Prelude Data.Array.Repa System.Random> shape = (Z :. 1000000)
Prelude Data.Array.Repa System.Random> array = fromFunction shape $ \(Z :. i) -> randomList !! i
Prelude Data.Array.Repa System.Random> sumP array仍然没有骰子:

我非常感谢在这件事上提供的任何进一步的帮助。
发布于 2017-09-05 02:27:54
不管是什么原因,ghci似乎忽略了某些输入选项,因此像sumP这样的一元计算将只使用一个CPU核心。然而,这个实验的目的是为我正在工作的个人项目使用多个内核,并且我在这个目标上取得了成功。我认为,关键是将-with-rtsopts=-N添加到我的ghc-options下的.cabal文件中。最终的ghc-options如下:
executable write
hs-source-dirs: app
main-is: Write.hs
ghc-options: -Odph
-rtsopts
-with-rtsopts=-N
-threaded
-fno-liberate-case
-funfolding-use-threshold1000
-funfolding-keeness-factor1000
-fllvm
-optlo-O3https://stackoverflow.com/questions/45985530
复制相似问题