首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我们能认为高相关性是一个很好的预测指标吗?

我们能认为高相关性是一个很好的预测指标吗?
EN

Data Science用户
提问于 2020-11-29 07:59:13
回答 2查看 44关注 0票数 0

预测新冠肺炎每日病例数量的问题确实具有挑战性,应该考虑到许多(外部)因素,才能找到一个合理的预测指标。然而,我们在2020年3月至11月期间研究了某个国家的Twitter (而不是英语),发现与症状X相关的每日推特数量与该国确诊病例数高度相关(pearson相关性0.84和p值0.00031)。

在数据科学领域,至少部分地说,每天发布的X推文是否足以预测新冠肺炎的数量?

EN

回答 2

Data Science用户

回答已采纳

发布于 2020-11-29 09:58:55

这不是几年前“谷歌流感趋势”故事的变体吗?(用“推特”代替“谷歌”,用“新冠肺炎”代替“流感”,用“推特”代替“搜索”。

说来话长。简而言之,谷歌搜索“流感”、“头痛”、“恶心”等词的频率是预测流感季节的最佳预测指标,直到它们没有。(当人们开始搜索“流感趋势”时?我不记得为什么)。有一个负反馈循环,预测变得不那么可靠。)

谷歌最终删除了这一功能,以避免批评,避免麻烦。

这里有许多论文,以及为什么它被脱机了。

票数 1
EN

Data Science用户

发布于 2020-11-29 09:30:29

在这种情况下,我将拟合一个线性模型(lm(tweets ~ cases)),然后使用引导或交叉验证来测试模型。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/86078

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档