我有一个数据集,它具有使用目标编码转换的分类特性。
在对模型进行拟合之后,我在拟合模型上使用石灰来理解一些单独的预测。
由于分类特征被转换为数字,由于编码石灰的解释变得模糊。
与其说恶臭之类的话,不如说气味< 0.24之类的话,这是毫无意义的。

我能做些什么?
发布于 2022-10-31 13:11:49
您使用的是热结尾还是绝对编码?
国名没有顺序或等级。但是,在执行标签编码时,国家名称是根据字母排列的。正因为如此,这个模型很有可能反映了印度、日本、美国等国之间的关系。
这是我们不想要的!那么,我们如何克服这一障碍呢?这里来了一个概念-热编码!
有关详细信息,请参阅下面的链接。
https://www.analyticsvidhya.com/blog/2020/03/one-hot-encoding-vs-label-encoding-using-scikit-learn/
https://datascience.stackexchange.com/questions/115648
复制相似问题