我正在研究Python熊猫,首先对我从csv文件创建的数据进行排序。我试图最终创建一个for循环,使用值进行比较。但是,当我打印新值时,它们使用的是原始的dataframe,而不是排序的版本。我如何正确地做下面的工作?
原始CSV数据:
date fruit quantity
4/5/2014 13:34 Apples 73
4/5/2014 3:41 Cherries 85
4/6/2014 12:46 Pears 14
4/8/2014 8:59 Oranges 52
4/10/2014 2:07 Apples 152
4/10/2014 18:10 Bananas 23
4/10/2014 2:40 Strawberries 98代码:
import pandas as pd
import numpy
df = pd.read_csv('example2.csv', header=0, dtype='unicode')
df_count = df['fruit'].value_counts()
x = 0 #starting my counter values or position in the column
df.sort_values(['fruit'], ascending=True, inplace=True) #sorting the column
fruit
print(df)
old_fruit = df.fruit[x]
new_fruit = df.fruit[x+1]
print(old_fruit)
print(new_fruit)发布于 2017-06-08 21:18:46
我相信您仍在访问旧的x索引。排序之后,插入以下内容以重新编制索引:
df.reset_index(drop=True, inplace=True)https://stackoverflow.com/questions/44445277
复制相似问题