文章/答案/技术大牛

发布

社区首页 >问答首页 >哪种模式最适合手术的结果？

问哪种模式最适合手术的结果？
EN

Data Science用户

提问于 2018-09-16 23:02:02

回答 1查看 52关注 0票数 1

新的数据科学，并试图成为一个自我启动和实施先进的数据分析在我的亚科外科。下面是我的数据集的描述。我知道我将不得不探索多种方法，但想得到你认为可能是最好的看法。我很可能会用R来完成这个分析。

拥有大约200名患者的数据集(行)
每个病人大约有10-15个变量(术前和术中)。
每个病人都接受过非手术治疗或手术治疗。
非手术治疗或手术治疗的成功与否取决于一份调查问卷，即患者在看到病人一年后填写。这份问卷给出了一个关于他们(1)受益还是(2)没有从手术中受益的二元结果。

我对这项研究的问题如下：

在手术组中，我试图找出哪些变量导致患者(1)受益与不受益于手术，并建立一个模型，可以更好地帮助预测哪些病人可以手术(我遗漏了一些细节，如病人人数，手术类型等)。
在第二项研究中，我想确定我们应该对哪些病人进行手术。换句话说，我想找出哪些术前特征使一些患者更有可能受益于(1)手术治疗和(2)非手术治疗，在这种情况下，结果也将是从问卷中得出的。

为此，我尝试过线性回归和逻辑回归，但效果并不好，因此我尝试学习更先进的模型。

更容易被临床医生理解的模型更有价值，这就是为什么我没有深入研究神经网络的原因。我感谢能提供的任何和所有的建议。此外，如果我将此数据集扩展到600人，您会使用另一种模式吗？我无法访问大型服务器，所以大部分都将在我的笔记本电脑上完成，但如果有必要，我可以使用在线资源(Azure等)。

感谢大家的帮助和投入。

machine-learning

predictive-modeling

model-selection

回答 1

Data Science用户

发布于 2018-09-17 11:28:09

Question 1:我建议将决策树作为您应该研究的第一件事，因为它们易于实现，而且结果很容易解释。您将得到一个树结构，其中节点保存变量的间隔/值。在每个节点上，树试图最有效地将数据拆分为二进制分类$C_1$和$C_2$。因此，最终，您将能够在树的顶部提取变量中最重要的特性。在选择属性时，典型的“效率”度量是熵。

Question 2:我认为它也是用上述方法解决的。对于树的每个节点，您都知道左边和右边的$C_1$和$C_2$分类的数量。假设节点中的属性是“有糖尿病”。你的数据(因此树)告诉你，110名病人中有100名“失败”了，如果患者患有糖尿病。因此，你可以给出一个关于特定属性对你的业务成功有多大贡献的评估，并得出结论认为对给定的人操作没有多大意义。

尽管如此，始终要注意如何解释结果。您不应该试图解释分割小子组的属性，因为这很容易导致对现实世界行为的错误假设。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/38355

复制

相似问题

问哪种模式最适合手术的结果？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问哪种模式最适合手术的结果？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问哪种模式最适合手术的结果？
EN