关于数据科学背后的科学和数学的书籍是什么?感觉上有那么多“数据科学”书籍是编程教程,不涉及数据生成过程和统计推断之类的东西。我已经可以编码了,我薄弱的是我正在做的事情背后的数学/统计/理论。
如果我准备在书上花1000美元(所以大约10本书.唉,我能买什么?
例如:分类数据分析,纵向数据的线性混合模型等.等等。
发布于 2014-06-12 16:52:46
导言:
深入挖掘:
一些特别感兴趣的例子:
更广泛的参考有助于机器学习(不是您所要求的,而是为了完整性):
奖金纸:
发布于 2014-06-11 13:49:08
如果我能给你推荐一个,那就是:哈斯蒂,蒂斯拉尼和弗里德曼的统计学习与预测的要素。它提供了数据科学中许多常用技术背后的数学/统计信息。
在贝叶斯技术方面,Gelman、Carlin、Stern、Dunson、Vehtari和Rubin的贝叶斯数据分析是很好的。
卡塞拉和伯杰的“统计推断”是一本在统计学理论基础上很好的研究生教材.这本书确实需要一个相当高的舒适度的数学(概率论是基于测量理论,这是不平凡的理解)。
关于数据生成过程,我没有推荐一本书。我可以说的是,很好地理解所使用的技术的假设,并确保以不违反这些假设的方式收集或生成数据,将大大有助于进行良好的分析。
发布于 2014-06-16 16:10:34
其他答案推荐了一套关于数据科学背后的数学的好书。但是正如你所提到的,它不仅仅是数学和数据收集和推理这样的活动有它们自己的规则和理论,即使没有数学背景那么严格。
对于这些部分,我建议这本书美丽的数据:优雅数据解决方案背后的故事包含20个案例研究,就像那些真正致力于现实世界数据分析问题的人所写的章节一样。它不包含任何数学,但探索领域,如收集数据,寻找实际的方法使用数据的分析,缩放和选择最好的解决方案非常好。
另一本非常有趣的书是用数据思考:如何将信息转化为洞察力,它也不是技术性的(=编程教程),但它涵盖了关于如何在决策和现实世界问题中真正使用数据科学力量的重要主题。
https://datascience.stackexchange.com/questions/313
复制相似问题