首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在进化环境中对二进制分类问题建模

如何在进化环境中对二进制分类问题建模
EN

Data Science用户
提问于 2019-06-07 10:27:22
回答 2查看 53关注 0票数 4

假设您对两个类(是或否)有问题。虽然“是”类是固定的,但在观察没有演化的意义上,“NO”类的观测值可能会随着时间的推移而演变,并可能转变为“是”类。我想预测一个给定的观测值改变为是的概率。

这里可以使用什么样的ML模型?贝叶斯网络是否是一种解决方案?

我还想观察哪些变量发生了变化(或者哪些变量是最重要的),哪些变量将“否”变成了“是”。

谢谢

EN

回答 2

Data Science用户

发布于 2019-11-28 18:44:14

如果你试图预测一些看起来像概率,但实际上不需要“真实”概率的东西(例如,如果你的目标是对观察结果排序,找出那些最有可能转换为“否”的人),那么你很可能会在数据集上使用逻辑回归。这将需要每隔一段时间对模型进行改装。

如果你在寻找实际的概率,那么在一段时间内,它必须是从“否”到“是”的概率。在这种情况下,您将进入时间序列分析。这是一个更复杂的问题。

我的直觉是把状态的变化看作是一种物理的随机现象,比如放射性衰变,在\Delta t时间周期内衰变的概率是e^{-\lambda \Delta t}。根据过去已经切换过的情况,您可以构建一个回归模型来预测每个观测的\lambda值。当然,您可以使用指数以外的其他衰变函数(通过验证步骤找到最佳衰减函数)。这将最终允许预测在任何给定时间内的切换概率。

票数 2
EN

Data Science用户

发布于 2019-11-28 17:24:45

这是个有趣的问题。这类似于法庭案件审判的一个例子--假设一个人在被证明有罪之前是无罪的(你的“否”标签),当他被证明有罪时就会继续有罪(你的“是”标签)。

现在,为了猜测一个人被转化为有罪的可能性,我会使用以下技巧:

方法1.对相似人群进行聚类,找出其他人的概率。通过拥有已经标记为YES的记录的相似特性,您可以对类似的案例进行聚类。您可以在这里使用社区检测来进行无监督的聚类。

方法2.使用马尔可夫链。如果您可以定义观察的可能步骤(或阶段),通常在转换为YES之前遵循这些步骤。然后,根据该特定记录后面的链,可以猜测概率。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/53381

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档