我有一个数据集,其中包括三种类型的变量:自然状态,人类决策,响应变量。我正在尝试使用决策树学习来使用其他变量来预测响应变量。
我的心理模型是,人们看着自然的状态并做出决定。因此,我强烈希望我的决策树首先根据自然变量的状态进行分区,然后根据人类决策变量进行分区。我不希望只是丢弃决策树模型中的所有变量,然后看看会弹出什么。
这个心理模型是有效的吗?如果是的话,我该如何使用Azure ML实现这样的东西呢?我甚至不知道用什么词来描述这个问题--这是“半监督”决策树学习吗?
发布于 2016-04-27 04:19:00
这里没有“半监督”部分。半监督意味着部分数据缺少标签(响应变量),但事实并非如此。您只需为决策树学习提出非常奇怪的约束,以处理最终的特征子集。为了做这样的事情,你需要改变DT学习过程,或者最好是从头开始编写代码。DT是非常简单的算法,它只需要几百行代码,你的修改是一个简单的if,里面写着“如果,在从根开始的路径上,我们还没有使用所有有意义的‘自然’特性,不要去研究‘人类的决定’”。因此,它是非常简单的,但我不认为任何库实际上支持这种约束(因为它很不自然,特别是对于DT)。
https://stackoverflow.com/questions/36874064
复制相似问题