我现在正在做泰坦尼克号的数据集。它由4-5个非数字列组成。我想要应用sklearn.LabelEncoder类来获得这些非数字列的编码值。毫无疑问,我可以将这种方法逐个应用于每一列。但是当有超过20-30个这样的列时,这项工作将变得更加单调乏味。既然我知道这些非数字列的名称,有没有什么复杂的方法可以轻松做到这一点?
发布于 2017-12-17 16:28:07
只需在选择对象类型后运行循环
obj_cols = df.select_dtypes(include=[object])
for i in obj_cols:
df[i+'label'] = le.fit_transform(df[i])https://stackoverflow.com/questions/47852014
复制相似问题