首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于不规则重复测量的预测?

基于不规则重复测量的预测?
EN

Data Science用户
提问于 2022-09-21 20:09:20
回答 1查看 75关注 0票数 1

我需要建立一个模型,根据健康相关问卷的答案来预测某些医疗结果。服务提供者让病人在不定期的时间间隔内多次填写这些问卷--例如,病人可能在其护理事件开始时填写一份问卷,34天后填写另一份问卷,12天后填写另一份问卷,以此类推。

我对如何处理我所预测的结果有很好的了解;我可以使用生存建模技术,也可以在特定的时间窗内将其作为二进制分类问题来处理。然而,当涉及到如何整合不规则重复的输入特性时,我有点不知所措:

  • 传统的时间序列技术假设观测间隔是固定的。
  • 递归神经网络通常会做出类似的假设。
  • 旁听的重复或聚合是最简单的解决方案,但我宁愿直接扔掉我的大部分数据。

有没有人知道对这类问题有用的模型或策略?

EN

回答 1

Data Science用户

发布于 2022-09-22 07:24:10

只要有足够的数据,时间序列模型就能达到很好的效果。如果你没有足够的数据给一个人,如果这些数据是不规则的,那么很有可能没有时间序列模型能够单独做出好的预测。因此,为了有足够的数据,您可以从统计的角度看到这个问题。这意味着考虑群体而不是个人。拥有一组人可以创建一组数据,这些数据可以很容易地被研究,而不需要100%的规则数据,但是足够有规律,以使模型能够识别模式。

下面是一种治疗心脏问题的药物的例子,BPM过高:

d0是对每个人进行医疗治疗的开始。

如果你有不规则的记录,你可以创建一组具有相似特征的人,这样你就可以获取大量基于时间的值,得到他们的平均值,并复制一个有规律的行为。

但是,您必须有大量的数据来减少因异常值而产生的错误,并获得相关的平均值。

因此,您可以采取类似的患者(与您的研究特定的相关特征,可能是体重、年龄、血型等),为每组记录值在d+1,d+2,.,d+N存在时,进行分组,并对所有这些记录应用logistic回归。如果这个组足够大,您应该能够拥有有趣的图表并应用有效的预测模型。

使用这种方法,您还可以通过调查异常值的原因、检测新的相关特性和改进模型来理解。

以下是针对稀缺和不规则数据的其他有趣的解决方案:https://www.inovex.de/de/blog/deep-learning-time-series/

https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/s12911-018-0717-4

https://www.researchgate.net/publication/318916950_SPARTan_可伸缩_PARAFAC2_为_大型_稀疏_数据

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/114597

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档