首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >多变量作为输入和输出

多变量作为输入和输出
EN

Data Science用户
提问于 2017-09-14 16:14:41
回答 1查看 1.1K关注 0票数 0

我正试图预测可能的诊断,给出咨询的理由。我有所有数据的身份证。所以我的数据如下所示

代码语言:javascript
复制
Reason            | Diagnosis
------------------------------
448, 124          | 9
551, 448, 122     | 9, 12
111, 110          | 32
143               | 43

在我的训练数据中,可能有多达10个原因和多达5个诊断。

我在算法或模型中寻找的是,它接受1-10 reason_ids作为输入,并以%的概率返回诊断的前5种可能性。

我很擅长python,所以如果有任何开源模型或代码,我可以看一看就很好了。

EN

回答 1

Data Science用户

发布于 2017-09-16 12:54:47

您可以通过两种方法来处理这个问题:

直觉上,这就像试图推断出这样的规律:如果原因是X和Y,诊断很可能是Z。

最常见的算法是先验,它易于实现。

  • 分类/监督学习

您的特性可以是二进制的(如果没有应用X,则为0;如果是的话,则为1)。每个原因都可以有一个,甚至合并了一些原因等等。如果您有很多可能的原因,您可能会遇到一些问题(您的特性将非常稀疏)。

如果是这样的话,我会研究降维,以使您的功能更加密集。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/23038

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档