我正在尝试在Azure ML Studio中找到与sklearn LabelEncoder或OrdinalEncoder等价物。我知道Convert to Indicator Values模块执行One-hot编码,但我找不到任何可以进行标签编码的东西。
我有一个包含6个唯一字符串值的列,我需要的是用从0到6的整数来表示该数据。
现在,我正在使用Execute Python脚本模块来做这件事,但是我想知道是否有内置的模块来做这件事。
发布于 2019-05-10 23:46:24
有一个Feature Hashing模块可以使用Vowpal Wabbit库将字符串转换为整数编码的特征。它构建一个字典,并基于此字典将其条目转换为散列值。因此,您将获得以下格式的数据,而不是字符串列:
Hashing feature 1 Hashing feature 2 Hashing feature 3
1 0 0https://stackoverflow.com/questions/56076313
复制相似问题