我有一个以'genre‘为列的数据框架。在此列中,每个条目都有多个值。例如,一部电影“哈利波特”可以在类型栏中有奇幻和冒险。当我在做数据分析和探索时,我不知道如何用多个值来表示这个列,以显示电影和/或类型之间的任何关系。
我曾想过使用图分析来显示这种关系,但我想探索我可以考虑的其他方法。
发布于 2018-06-03 19:13:15
您可以通过流派将str.get_dummies用于新的指标列:
df = pd.DataFrame({'Movies': ['Harry Potter', 'Toy Story'],
'Genres': ['fantasy,adventure',
'adventure,animation,children,comedy,fantasy']})
#print (df)
df = df.set_index('Movies')['Genres'].str.get_dummies(',')
print (df)
adventure animation children comedy fantasy
Movies
Harry Potter 1 0 0 0 1
Toy Story 1 1 1 1 1https://stackoverflow.com/questions/50665704
复制相似问题