我正在处理一个twitter数据,我想绘制它以显示一天中有多少推文发生。我使用groupby函数来计算有多少条推文出现。date数据类型已转换为datetime。它看起来大致是这样的。
date tweet
2020-07-25 12:27:21 2
2020-02-13 10:04:16 4我尝试了这段代码,但得到了一个ValueError: x and y must have same first dimension
fig, ax = plt.subplots()
ax.plot_date(df['date'], df['tweet'])做这件事最好的方法是什么?另外,由于我只需要日、月和年的格式,是否需要删除小时、分钟和秒?如果是,请在答案中包括在内。
发布于 2020-08-13 17:59:12
希望这能对你有所帮助!
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame([['2020-07-25 12:27:21', 2], ['2020-02-13 10:04:16', 4]], columns = ['Date', 'Tweet'])
df['Date'] = pd.to_datetime(df['Date'], format='%Y-%m-%d %H:%M:%S').dt.strftime('%m/%d/%Y')
df['Date'] = df['Date'].apply(lambda x : ' ' if x=="NaT" else x)
cou = df['Tweet'].values
dat = df['Date'].values
plt.bar(dat, cou)
plt.legend()
plt.xlabel('Date')
plt.ylabel('Count')
plt.show()

https://stackoverflow.com/questions/63392056
复制相似问题