这听起来像一个垃圾问题,但作为一个初学者,我真的很困惑。
在我的学术论文中,我选择了一篇关于医疗保健中的大数据领域的会议论文。现在的问题是获取数据集。
我找不到任何资源来下载数据集来处理它。当我搜索它时,人们建议使用一些资源,这些资源确实很好,但是那些文件并不大,可以称之为大数据。在这一点上我真的很困惑,没有人能给出正确的答案。
我在想,也许我们可以在小批量数据集上工作,并进一步将大数据模型应用于生产领域。然而,这只是一个假设。我想知道,对于学术层面的论文或分析研究,我们能否免费下载现实生活中的大数据集?
如果我遗漏了什么,请纠正我。提前谢谢。
发布于 2018-07-07 23:34:46
看看https://goo.gl/yCZvSb,Gapminder的一个视图。在这519个中,你可能会找到一个合适的。
为了你的论文的目的,我鼓励你考虑大数据的高维数据与n >>的典型临床试验。如果你发现与健康相关的观测数据,而不是生命统计数据,比如出生/死亡的数量,甚至涉及10^9的比例数据,我会感到非常惊讶。
https://datascience.stackexchange.com/questions/34116
复制相似问题