我正在尝试使用hadoop来练习一些数据挖掘算法。我可以单独使用HDFS来做这件事吗,或者我需要使用hive/hbase/pig这样的子项目吗?
发布于 2010-07-19 14:22:28
我找到了一个大学网站,里面有一些MapReduce的练习和解决方案,它们都是在Hadoop上构建的:
http://www.umiacs.umd.edu/~jimmylin/Cloud9/docs/index.html
此外,还有来自雅虎和谷歌的课程:
http://developer.yahoo.com/hadoop/tutorial/
http://code.google.com/edu/parallel/index.html
所有这些课程都使用普通的Hadoop来回答您的问题。
发布于 2010-08-19 05:22:59
从初学者级别的普通mapreduce开始。你可以尝试下一级的Pig/Hive/Hbase。
你将无法欣赏Pig/Hive/Hbase,除非你努力使用简单的map reduce
发布于 2010-07-19 14:25:28
我也推荐umd网站。但是,看起来您对Hadoop完全陌生。我推荐汤姆·怀特的“the :Hadoop定义指南”这本书。它有点过时[意味着0.18版本,而不是最新的0.20+)。阅读它,做例子,你应该在一个更好的地方来判断如何构建你的项目。
https://stackoverflow.com/questions/3277780
复制相似问题