我有一个CSV文件,其中包含四列和多行,所以我隐藏了这些列,然后创建了一行和多个列,然后我想用特定的id保存到新文件中,我的意思是,我有4个唯一的id,所以对于每个id,它都会保存到新文件中,但不幸的是,我发现了这个错误。
KeyError:“id 'x_center‘'y_center’不在索引中”
这是我的代码
import pandas as pd
df= pd.read_csv('./1_1.csv')
df=df.sort_values(by = 'id')
s = df['id'].unique()
for i in s:
df=df[["id" ,"x_center" , "y_center"]][df['id']==i].stack().to_frame().T
df=df.T.drop_duplicates().T
pd.DataFrame(df).to_csv('%d id.csv'% (i) , index = True, header=True)发布于 2021-04-11 00:15:03
不太确定你想做什么。
for i in s:
df=df[["id" ,"x_center" , "y_center"]][df['id']==i].stack().to_frame().T
df=df.T.drop_duplicates().T
pd.DataFrame(df).to_csv('%d id.csv'% (i) , index = True, header=True)在这个for循环中,df在每个循环之后被更改。所以在第一个循环之后,df就像
0
id x_center y_center
0 1 3 5您可以看到有多列,这就是为什么您有['id' 'x_center' 'y_center'] not in index。
要解决这个问题,我认为最好的方法是保留原始数据的副本,并对该数据进行过滤。
origin = pd.read_csv('./1_1.csv')
origin = origin.sort_values(by = 'id')
s = df['id'].unique()
for i in s:
df = origin.copy()
df = df[["id" ,"x_center" , "y_center"]][df['id']==i].stack().to_frame().T
df = df.T.drop_duplicates().T
pd.DataFrame(df).to_csv('%d id.csv'% (i) , index = True, header=True)https://stackoverflow.com/questions/67038523
复制相似问题