在python中,我正在构建一个简单的单词频率计数器应用程序。这份文件有将近160万字。我把工作(句子)平分在线上。理想情况下,除了运行时间随着线程数量的增加而减少(直到某个阈值)外,在我的测试中似乎不是这样的。由于某种原因,每次单线程都比多线程实现快得多。早些时候,我使用锁写入全局哈希表,但我发现对于多线程环境来说,这是非常低效率的(至少要慢2-3倍)。然后,我开始为每个线程编写单独的哈希表,并最终将它们合并。单线程方法现在需要时间~4.5秒,但是多线程方式至少慢一两秒钟。对我做错了什么有什么想法吗?
https://stackoverflow.com/questions/34349674
复制相似问题