我想从一个非常大的json文件中提取abstractText。我使用python中的lib ijson,但是我找不到正确的方法来提取我想要的东西。
json文件的结构是
{'articles'=[{"abstractText":"text..", "journal":"journal..", "meshMajor":["mesh1",...,"meshN"], "pmid":"PMID", "title":"title..", "year":"YYYY"},..., {..}]
你能帮我吗?
提前谢谢你
发布于 2014-03-22 14:23:48
这是无效的JSON。单引号'articles'必须是双引号"articles",并且在"articles"之后应该有一个:而不是=。假设它是正确的,您应该使用:
json["articles"][0]["abstractText"]编辑:ijson库的完整示例:
import ijson
f = open('json.txt')
objects = ijson.items(f, 'articles.item')
for obj in objects:
print obj["abstractText"]发布于 2020-08-03 09:39:30
with open('file_name.json', 'rb') as input_file:
parser = ijson.parse(input_file)
for parent, data_type, value in parser:
print('parent={}, data_type={}, value={}'.format(parent, data_type, value))https://stackoverflow.com/questions/22578751
复制相似问题