文章/答案/技术大牛

发布

问熊猫数据合并问题
EN

Stack Overflow用户

提问于 2013-04-04 12:38:18

回答 1查看 2.4K关注 0票数 2

我正在通过韦斯·麦金尼的python学习蟒蛇和熊猫的数据分析。第2章中的一个例子是MovieLens数据在movie_id上的合并不起作用。我认为问题在于，在评级方面，movie_id是一个int64，而在电影中，它是一个对象。合并返回一个空数据帧。

我以前读过一些关于熊猫和自动数据类型分配的文章，并在pandas.io.parsers.read_table文档中找到了dtype，但是无法改变类型。

原始代码：

mnames = ['movie_id', 'title', 'genres']
movies = pd.read_table('ch02/movielens/movies.dat', sep='::', header=None, names=mnames)

我的研究表明什么应该起作用：

movies = pd.read_table('ch02/movielens/movies.dat', sep='::', header=None, names=mnames, dtype={'movie_id':np.int64})

不幸的是，类型没有改变，合并仍然返回一个空集。我在经营熊猫0.10.1

发布于 2013-04-29 05:34:59

(请注意，我还没有查过书码，只是你的帖子)

首先确认dtype：

print ratings_df.dtypes
print movies_df.dtypes

如果您发现它们是不同的类型，可以尝试(假设ratings_df.movie_id是对象而不是int)：

ratings_df.movie_id = ratings_df.movie_id.astype(int)

看看你的合并现在是否有效。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/15811414

复制

相似问题

问熊猫数据合并问题EN