首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >pandas列的To_CSV唯一值

pandas列的To_CSV唯一值
EN

Stack Overflow用户
提问于 2016-03-20 05:07:45
回答 2查看 21.6K关注 0票数 14

当我使用以下命令时:

代码语言:javascript
复制
import pandas as pd
data = pd.read_csv('C:/Users/Z/OneDrive/Python/Exploratory Data/Aramark/ARMK.csv')
x = data.iloc[:,2]
y = pd.unique(x)
y.to_csv('yah.csv')

我得到以下错误:

代码语言:javascript
复制
AttributeError: 'numpy.ndarray' object has no attribute 'to_csv'
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-03-20 05:39:25

IIUC,从数据帧开始:

代码语言:javascript
复制
df = pd.DataFrame({'a':[1,2,3,4,5,6],'b':['a','a','b','c','c','b']})

您可以使用以下命令获取列的唯一值:

代码语言:javascript
复制
g = df['b'].unique()

返回一个数组:

代码语言:javascript
复制
array(['a', 'b', 'c'], dtype=object)

要将其保存到.csv文件中,我会将其转换为Series s:

代码语言:javascript
复制
In [22]: s = pd.Series(g)

In [23]: s
Out[23]: 
0    a
1    b
2    c
dtype: object

所以你可以很容易的保存它:

代码语言:javascript
复制
In [24]: s.to_csv('file.csv')

希望这能有所帮助。

票数 17
EN

Stack Overflow用户

发布于 2016-03-20 05:38:03

熊猫相当于np.unique的是drop_duplicates method

代码语言:javascript
复制
In [42]: x = pd.Series([1,2,1,3,2])

In [43]: y = x.drop_duplicates()

In [46]: y
Out[46]: 
0    1
1    2
3    3
dtype: int64

请注意,drop_duplicates返回一个Series,因此您可以调用它的to_csv方法:

代码语言:javascript
复制
import pandas as pd
data = pd.read_csv('C:/Users/Z/OneDrive/Python/Exploratory Data/Aramark/ARMK.csv')
x = data.iloc[:,2]
y = x.drop_duplicates()
y.to_csv('yah.csv')
票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36107180

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档