首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫:数据融合的问题

熊猫:数据融合的问题
EN

Stack Overflow用户
提问于 2016-04-22 18:51:29
回答 1查看 880关注 0票数 0

我正在尝试合并以下两个数据格式on=SICcode

代码语言:javascript
复制
df.head(5)

    SICcode     Catcode     Category                            SICname     MultSIC
0   111         A1500   Wheat, corn, soybeans and cash grain    Wheat        X
1   112         A1600   Other commodities (incl rice, peanuts)  Rice         X
2   115         A1500   Wheat, corn, soybeans and cash grain    Corn         X
3   116         A1500   Wheat, corn, soybeans and cash grain    Soybeans     X
4   119         A1500   Wheat, corn, soybeans and cash grain    Cash grains  X

df.columns.tolist()

['\ufeffSICcode', 'Catcode', 'Category', 'SICname', 'MultSIC']  

merged.head()


2012 NAICS Code     2002to2007 NAICS    SICcode
0   111110          111110               116
1   111120          111120               119
2   111130          111130               119
3   111140          111140               111
4   111150          111150               115

 merged.columns.tolist()
['2012 NAICS Code', '2002to2007 NAICS', 'SICcode']

当我试图将它们与以下代码合并时:

代码语言:javascript
复制
merged=pd.merge(merged,df, how='left', on='SICcode')    

我得到了一个Keyerror: 'SICcode',我试图设置dfs的dtype of ,但是当我这样做时,我收到了一个Keycode error

如果有人对此有任何想法或要求更多的信息,请告诉我。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-04-22 19:05:46

请注意第一栏:

代码语言:javascript
复制
In [27]: df = pd.read_csv('https://github.com/108michael/ms_thesis/raw/master/df.test', index_col=0)

In [28]: df.columns.tolist()
Out[28]: ['\ufeffSICcode', 'Catcode', 'Category', 'SICname', 'MultSIC']

In [29]: df['SICcode']

...

KeyError: 'SICcode'

In [30]: df['\ufeffSICcode'].head()
Out[30]:
0    111
1    112
2    115
3    116
4    119
Name: SICcode, dtype: int64

正如@unutbu在他的评论中所说,将encoding='utf-8_sig'添加到pd.read_csv()调用中可能会帮助您解决这个问题:

代码语言:javascript
复制
In [31]: df = pd.read_csv('https://github.com/108michael/ms_thesis/raw/master/df.test', index_col=0, encoding='utf-8_sig')

In [32]: df.columns.tolist()
Out[32]: ['SICcode', 'Catcode', 'Category', 'SICname', 'MultSIC']
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36801328

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档