我在dataset下面,但是它的值是字符串。因此,当我想要训练决策树时,应该通过标签编码将这些特征转换为num。如何在可视化步骤和规则导出中在决策树上打印这些字符串?
feature1 feature2 feature3 feature4 target
low low medium high sick
low high medium medium sick
high medium low high health
...这是我创建决策树的代码:
le = preprocessing.LabelEncoder()
le.fit(data)
encoded_data = le.transform(data)
tree.fit(encoded_data, target)发布于 2018-10-15 06:47:34
打印类的映射:
list(le.classes_)将标签反向转换为分类:
list(le.inverse_transform(list_of_labels))这里.
您还可以使用熊猫.factorize():
cat_list = ['a', 'b', 'c', 'd', 'd']
encoded_data, mapping_index = pd.Series(cat_list).factorize()https://stackoverflow.com/questions/52810906
复制相似问题