首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在超大型文件中搜索(开放学术图表/微软学术图表)

在超大型文件中搜索(开放学术图表/微软学术图表)
EN

Stack Overflow用户
提问于 2020-08-05 13:38:28
回答 1查看 196关注 0票数 1

我下载了三种不同的MAG (Microsoft-学术图表)-Files

  1. MAG场馆(~ 10 MAG)
  2. MAG论文(~ 30 MAG)
  3. MAG作者(~ 30 MAG)

来自开放学术图

现在,我想从MAG File中搜索ID,以获得关于作者出版物的更多信息(~30 of )。

问题是:

我试图使用Python搜索文件中的ID,例如:

代码语言:javascript
复制
import ast
import timeit

with open("/Users/xyxz/Downloads/mag_authors_2/mag_authors_10.txt") as f:
    for line in f:
        xy = ast.literal_eval(line)
        if(xy["id"] == "2806941709"):
            print(xy)

时间: 85秒

有人能帮我在搜索中得到更多的表演吗?C或C++更快吗?

EN

回答 1

Stack Overflow用户

发布于 2021-01-25 03:59:39

  1. 您可以将一个大文件拆分为多个内容,在每个内容中使用多个线程进行搜索。
  2. 使用编译的regex或KMP搜索algo。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63266449

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档