首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >处理具有多个用于数据分析的值的pandas列

处理具有多个用于数据分析的值的pandas列
EN

Stack Overflow用户
提问于 2018-06-03 19:06:30
回答 1查看 1.9K关注 0票数 1

我有一个以'genre‘为列的数据框架。在此列中,每个条目都有多个值。例如,一部电影“哈利波特”可以在类型栏中有奇幻和冒险。当我在做数据分析和探索时,我不知道如何用多个值来表示这个列,以显示电影和/或类型之间的任何关系。

我曾想过使用图分析来显示这种关系,但我想探索我可以考虑的其他方法。

EN

回答 1

Stack Overflow用户

发布于 2018-06-03 19:13:15

您可以通过流派将str.get_dummies用于新的指标列:

代码语言:javascript
复制
df = pd.DataFrame({'Movies': ['Harry Potter', 'Toy Story'],
                   'Genres': ['fantasy,adventure', 
                              'adventure,animation,children,comedy,fantasy']})

#print (df)


df = df.set_index('Movies')['Genres'].str.get_dummies(',')
print (df)
              adventure  animation  children  comedy  fantasy
Movies                                                       
Harry Potter          1          0         0       0        1
Toy Story             1          1         1       1        1
票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50665704

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档