我爱上了数据科学,我花了很多时间研究它。一个常见的数据科学工作流程似乎是:
当涉及到数据的工作时,我很难把这些点连接起来。我知道第四步是乐趣发生的地方,但我不知道从哪里开始。在处理数据时,采取了哪些步骤?我需要找到中心趋势还是标准差?需要机器学习吗?
Ps:我知道这些都是宽泛的问题,所以请在你自己的专业知识范围内回答。
发布于 2016-07-03 09:56:19
至于使用数据取决于一个人的教育,专业知识,目标和最喜欢的工具,我会回答它在我的狭窄范围-并试图保持您的跟踪。

发布于 2016-07-03 08:47:43
这是一个很好的框架来解决你的问题。据我所知,它有多个答案。我会给你我所关心的那个。
在清理数据之后,或者更确切地说,在清理数据时,我们必须清楚前面的任务和我们的结果。数据方面的工作主要遵循以下步骤:
https://datascience.stackexchange.com/questions/12564
复制相似问题