我正在实现模式挖掘算法,通常输入的数据是以下格式的文件
item1 item2 item3
item0 item3 item10
....
item30 item40 item30其中itemx通常是一个String。为了提高效率,我过去常常使用比默认String更快的ByteString读取文件。因为模式挖掘算法的最大任务是项目集之间的比较。我想知道如果我改变输入文件格式来进行Int之间的比较而不是ByteString之间的比较,我的程序会变得更快还是更慢。这是一个新颖的格式:
1 2 3
0 3 10
....
30 40 30谢谢!
发布于 2013-01-02 20:51:51
如果您将自己限制为只询问Int上的相等函数--由eqInt# primop给出--是否比字节串上的相等函数快--
primop IntEqOp "==#" Compare
Int# -> Int# -> Bool
with commutable = Truevs
eq :: ByteString -> ByteString -> Bool
eq a@(PS fp off len) b@(PS fp' off' len')
| len /= len' = False -- short cut on length
| fp == fp' && off == off' = True -- short cut for the same string
| otherwise = compareBytes a b == EQ
{-# INLINE eq #-}那么Int的情况会更快。确实是这样。
但是,如果您必须首先将字节字符串输入(或字符串输入)解析为Int标记,则可能会失败。
真正了解这里的唯一方法是测量。
https://stackoverflow.com/questions/14116675
复制相似问题