我正在尝试抓取一个网站,并将其内容转换为JSON。我已经能够编写代码来抓取它和它的所有子类别,但是我不知道如何使用以下结构生成一个好的JSON文件
Category[1]: "Name of category"
Article[1]
Title: "Some title"
Text: "Some Text"
Image: "Some image"
Article[2]
...
...
...
...
Category[2]: "Name of category"
Article[1]
Title: "Some title"
Text: "Some Text"
Image: "Some image"
Article[2]
...
...
...
...我是python的新手,所以任何解释都是非常感谢的。谢谢!
发布于 2014-08-10 23:34:14
由于您显示的输出并不接近有效的JSON,所以我不能确切地确定您想要什么输出。但答案是一样的:
不用担心“创建JSON文件”。只需创建一个充满字典和列表字典,然后调用json.dump将该字典转换为JSON文件。
例如,可能是这样的:
categories = {}
for thing in thingies:
name = get_next_category_name()
articles = get_articles(name)
categories[name] = [convert_article(article) for article in articles]
with open(path, 'w') as f:
json.dump(categories, f)https://stackoverflow.com/questions/25230114
复制相似问题