我有一个数据库(可访问:https://datacatalog.worldbank.org/search/dataset/0041443/World---Global-Tracking-Framework,下载“可再生能源指示结果”CSV文件),我需要使用和操作。目的是将数据库导入python,删除2列,添加和增加列,其内容是24年数据收集(1990-2014年)的平均数量。在完成所有这些工作之后,第一栏应该是由“总最终能源消耗(TJ)”、“可再生能源占TFEC的比重(%)”、“可再生能源消耗(TJ)”、“可再生电力占总发电量的比例(%)”、“总发电量(GWh)”、“可再生电力输出(GWh)”等国家名称组成的系列名称,然后是1990-2014年的数据和平均数。我遇到的问题是,数据被按列分割两次,第一次是按系列名称,然后是国家。我希望将这些数据输出到xlsx文件中,其中excel文件有6个工作表,每个工作表包含相对于系列名称的数据。即一张总最终能源消耗(TFEC)表(TJ),其中第一栏是国家名称,然后是其后年份的数据,然后是其他系列的相同数据。
我对编码很陌生,到目前为止很难找到这个问题的解决方案。下面是我到目前为止能够想出的代码。PS im使用jupyter笔记本编写代码。
1: import pandas as pd
2: df = pd.read_csv('gtfrenewableenergydata.csv')
3: df.drop(['Series Code', 'Country Code'], inplace=True, axis=1)
4: df.insert(27,"Total Average",df.mean(axis=1))
5: my_writer = pd.ExcelWriter('ExcelProject.xlsx', engine = 'xlsxwriter')
6: df.to_excel(my_writer, sheet_name = 'Renewable Energy Project', index = False)
7: my_writer.save()我知道在第4行:代码是不正确的,因为新列生成的是NaN,而不是24年的平均值。在将数据分割成多个工作表时,我也完全没有代码,因为我还不能确定其中的一个。
任何帮助都将不胜感激!!
发布于 2021-12-07 20:52:40
对于excel文件,您可以这样做来写入多个工作表。这假设Total final energy consumption (TFEC) (TJ)是要拆分的列,以获得单独的工作表。
my_writer = pd.ExcelWriter('ExcelProject.xlsx', engine = 'xlsxwriter')
for key,g in df.groupby('Total final energy consumption (TFEC) (TJ)'):
g.to_excel(my_writer, sheet_name=key, index=False, header=True)https://stackoverflow.com/questions/70266467
复制相似问题