首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫数据合并问题

熊猫数据合并问题
EN

Stack Overflow用户
提问于 2013-04-04 12:38:18
回答 1查看 2.4K关注 0票数 2

我正在通过韦斯·麦金尼的python学习蟒蛇和熊猫的数据分析。第2章中的一个例子是MovieLens数据在movie_id上的合并不起作用。我认为问题在于,在评级方面,movie_id是一个int64,而在电影中,它是一个对象。合并返回一个空数据帧。

我以前读过一些关于熊猫和自动数据类型分配的文章,并在pandas.io.parsers.read_table文档中找到了dtype,但是无法改变类型。

原始代码:

代码语言:javascript
复制
mnames = ['movie_id', 'title', 'genres']
movies = pd.read_table('ch02/movielens/movies.dat', sep='::', header=None, names=mnames)

我的研究表明什么应该起作用:

代码语言:javascript
复制
movies = pd.read_table('ch02/movielens/movies.dat', sep='::', header=None, names=mnames, dtype={'movie_id':np.int64})

不幸的是,类型没有改变,合并仍然返回一个空集。我在经营熊猫0.10.1

EN

回答 1

Stack Overflow用户

发布于 2013-04-29 05:34:59

(请注意,我还没有查过书码,只是你的帖子)

首先确认dtype:

代码语言:javascript
复制
print ratings_df.dtypes
print movies_df.dtypes

如果您发现它们是不同的类型,可以尝试(假设ratings_df.movie_id是对象而不是int):

代码语言:javascript
复制
ratings_df.movie_id = ratings_df.movie_id.astype(int)

看看你的合并现在是否有效。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15811414

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档