我通过Tweepy收集了一个完整的tweet数据集,并将它们保存为json文件。现在,我想根据需要转换csv文件中的数据。像只有文本,用户名,创建于和4-5列。我怎么做可以任何人请提供我的python代码这一点。另一个问题是,在csv中转换数据时,我的tweet文本也会在任何逗号出现的地方被拆分。请帮帮我们。我是这个领域的新手。提前谢谢。

发布于 2018-02-06 20:32:17
您需要读取您的文件,并将每个非空行从json格式转换。然后,您可以使用itemgetter()从结果字典中提取所需的键,并将结果写入output.csv文件:
from operator import itemgetter
import csv
import json
header = ['text', 'username', 'created_at']
required_cols = itemgetter(*header)
with open('python1.json') as f_input, open('output.csv', 'wb') as f_output:
csv_output = csv.writer(f_output)
csv_output.writerow(header)
for row in f_input:
if row.strip():
csv_output.writerow(required_cols(json.loads(row)))如果您使用的是Python 3.x,请使用以下行:
with open('python1.json') as f_input, open('output.csv', 'w', newline='') as f_output:https://stackoverflow.com/questions/48641301
复制相似问题