我使用import Text.Parsec.Text和import Text.Parsec.Char来解析一些包含整数的数据。我使用下面的代码来解析整数。
p_int :: Parser Int
p_int = read <$> ((++) <$> option "" (string "-") <*> many1 digit)我分析了我的程序,结果发现上面的片段花费了执行时间的90%以上。如何优化上述代码?
我遇到了Text.ParserCombinators.Parsec.Number模块,它包含一个解析整数的int函数。但是,它的类型是int :: Integral i => CharParser st i,它与我使用的基于Text的解析器不兼容,从下面的错误可以看出这一点。
• Couldn't match type ‘[Char]’ with ‘Text’
Expected type: Parser Int
Actual type: Text.ParserCombinators.Parsec.Char.CharParser () IntUPDATE我用Text.Parsec.String代替了Text.Parsec.Text,用Text.ParserCombinators.Parsec.Number的int替换了int解析函数。这使执行时间缩短了40%。但是,与Python相比,性能更差。特征分析表明,在int分析中消耗了80%的时间。这是不是意味着Parsec太慢了?
COST CENTRE MODULE SRC %time %alloc
sign Text.ParserCombinators.Parsec.Number Text/ParserCombinators/Parsec/Number.hs:277:1-73 34.4 39.8
number Text.ParserCombinators.Parsec.Number Text/ParserCombinators/Parsec/Number.hs:(321,1)-(323,18) 26.7 27.5
numberValue Text.ParserCombinators.Parsec.Number Text/ParserCombinators/Parsec/Number.hs:(327,1)-(328,74) 10.2 6.7
zeroNumber Text.ParserCombinators.Parsec.Number Text/ParserCombinators/Parsec/Number.hs:(300,1)-(301,56) 6.0 10.0
...
....
int Text.ParserCombinators.Parsec.Number Text/ParserCombinators/Parsec/Number.hs:273:1-17 499 0 1.4 1.6 79.5 86.5发布于 2020-01-17 14:56:24
我用Attoparsec代替了Parsec,没有任何优化,它现在快了80%。此外,“总分配数”也从超过3GB降至507 is。
API在这两个库之间非常相似,因此迁移起来并不困难。如果可能的话,我将尝试进一步优化它,看看它能达到多快。
https://stackoverflow.com/questions/59752788
复制相似问题