在“过程挖掘:数据科学在行动”(2016 - Van der Aalst,pag 11)的导言一章中,作者说:
虽然数据科学可以被看作是统计的延续,但大多数统计学家对最近数据科学的进展贡献不大。大多数统计学家关注的是理论结果,而不是现实世界的分析问题。对于较大的数据集至关重要的计算方面,通常被统计学家忽略。重点是生成建模,而不是预测和处理与数据质量和大小有关的实际挑战。
我对这句粗话不太清楚。事实上,由于生成模型是生成数据的模型,所以一旦我们获得数据,我们就可以进行预测。所以,对我来说,生成模型和预测并不是对立的概念。你觉得呢?
发布于 2018-07-19 10:53:47
这是相当理论性的。我会努力简化。假设一个鸡蛋在鸡蛋店花了3块钱
为了得到3个鸡蛋,你需要口袋里的9块钱。-但是(如果你是出纳员)-有人拿着9块钱告诉他/她想要3个鸡蛋
买家需要有一个工程师的头脑和“建立”的决定是多少钱是需要,而出纳员需要有一个科学家的想法,并打破了9美元的场景,这个人想要3个鸡蛋。
数据科学随着数据的可用性爆炸和真实世界的(数据)拷贝而变得更多(在这里,你将现实世界理解为科学家),而生成思维则更多地是关于为现实世界构建一个解决方案的工程。
https://datascience.stackexchange.com/questions/35715
复制相似问题