问如何在有监督的场景下基于多个特征的相关性进行分类
EN

Stack Overflow用户

提问于 2017-07-28 13:58:59

回答 1查看 98关注 0票数 0

我有两个特征：“Contact_Last_Name”和“Account_Last_Name”，我想根据这两个特征对我的数据进行分类:逻辑是，如果这两个特征相同，即Contact_Last_Name与Account_Last_Name相同，那么结果就是“成功”，否则就是“拒绝”。所以。例如:如果Contact_Last_Name是'Johnson‘，而Account_Last_Name是'Eigen’，则结果被分类为'Denied‘。如果两者相等，比如'Edison‘，那么结果就是'Success’。如何，我可以对这组数据有一个分类算法？请注意，通常我们会丢弃高相关性列，但在这里，列之间的相关性似乎具有分类的逻辑

我尝试在R中使用决策树(c5.0)和朴素贝叶斯(NaiveBayes)，但这两种方法都无法正确地对数据集进行分类。

correlation

machine-learning

classification

回答 1

Stack Overflow用户

发布于 2017-07-28 14:06:05

首先，这不是机器学习的好用例，因为这可以通过字符串匹配来完成，但是如果你想给一个分类算法，那么创建一个值为'Contact_Last_Name‘，'Account_Last_Name’和'Result‘的表，并将其用于决策树并预测第三列。

请注意，您对数据进行了分区以进行训练和测试。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/45365896

复制

相似问题

问如何在有监督的场景下基于多个特征的相关性进行分类
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在有监督的场景下基于多个特征的相关性进行分类EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在有监督的场景下基于多个特征的相关性进行分类
EN