假设我们有一套治疗计划(可供选择)给病人。治疗计划可以是侵入性手术,非手术,非侵入性手术.
我们有一个数据集,其中一个治疗方案是为病人选择的,我们也有他们的结果(存活/没有生存)。
什么是最好的方法来进行分级/排名/选择一个最优的治疗方案,这样我们才能保持最佳的存活率。
对我来说,这听起来像是一种推荐算法,但大多数推荐算法的工作方式似乎是根据是否选择了该选项来建模最佳推荐/选项。这里的结果不是是否选择了特定的治疗/推荐(非选择的治疗可能更好),而是患者是否在选定的治疗后存活下来。考虑到我们对未被选择的选择没有结果,只有被选择的治疗才有结果--我如何才能最好地创建一个模型,产生一个级别/等级的最佳治疗计划,以增加生存的可能性?下面的示例数据集

发布于 2022-08-08 17:02:32
第一步是计算描述性统计。从成活率开始,按组排序,由高到低。
逻辑上的跟进问题是:群体差异是偶然造成的吗?零假设显着性检验(NHST)是回答这个问题的一种方法。无效假设是,群体之间没有差异。如果这个零假设可以被拒绝的话,卡方检验是评估证据的一种可能的统计检验。
对于这个问题,推荐算法是一个过于复杂的工具。
https://datascience.stackexchange.com/questions/107815
复制相似问题