我有下面的数据框
col
A a
A b
A c
B d
B e
C f我想要获取虚拟变量
a b c d e f
A 1 1 1 0 0 0
B 0 0 0 1 1 0
C 0 0 0 0 0 1我怎么才能得到这个呢?
我试过了
df.col.get_dummies()
但我不能组队。
发布于 2017-03-09 20:42:33
您需要按索引和聚合max的groupby
print (df.col.str.get_dummies().groupby(level=0).max())
a b c d e f
A 1 1 1 0 0 0
B 0 0 0 1 1 0
C 0 0 0 0 0 1或者:
print (pd.get_dummies(df.col).groupby(level=0).max())
a b c d e f
A 1 1 1 0 0 0
B 0 0 0 1 1 0
C 0 0 0 0 0 1https://stackoverflow.com/questions/42695672
复制相似问题