我使用了相同的方法/参数来创建两个决策树。树木根据各种症状的存在与否,对是否有医疗状况进行分类。有一棵树用于治疗#1,另一棵树用于治疗#2。这两棵树都是基于相同的症状,被患者评定。如果第一种医疗条件导致的树比第二种医疗条件简单得多,那么这能说明第二种医疗条件是一种更复杂的疾病吗?如果是这样的话,有谁能指出一个引用,说明树的复杂性/深度可以代表一个复杂的条件?
我分析的目的与这个问题是分开的。我正试图从我的分析中找出我能得出或提出的所有结论。是的,我想说一些关于条件A到B的复杂性的东西。什么时候条件比较复杂?当有许多症状,因为疾病是由症状诊断。如果很难诊断的话?如果症状严重的话?两种条件都有吗?不是
发布于 2015-02-19 22:17:45
不,你不能推断。我假设你有相同的训练集,有同样的预测因子(症状)。训练集中唯一的区别是针对每个病人的二进制类标签。
较小的树的意思是:-在给定的症状下,可能更容易区分有1种症状的人和没有这种症状的人。(由于你有相同的确定性和较少的信息)这种区别似乎更难与医疗条件2,这是你必须考虑更多的症状,以确定你的分类。因此,如果条件2是一种非常轻微的情况,即使对专家来说也很难诊断,如果有人有,那么它会导致一棵深邃的树。
https://datascience.stackexchange.com/questions/5170
复制相似问题