这不是一个技术性的问题,但想得到更有经验的人对我的职业生涯的建议。过去13年来,我一直担任UNIX管理员,大部分时间都是Solaris,在Linux上工作了几年。现在,我想学到更多能超越我职业生涯的东西。我听到了很多关于Hadoop/大数据的消息。我没有任何编程或脚本知识,也不了解apache或任何数据库。-我假设有两种不同的职务简介,即开发人员和行政人员。我是否正确地理解了它?-我是否需要学习apache、数据库、java来学习Hadoop (甚至对于Admin作业配置文件)?--在我所在的地方,培训是很昂贵的。如果我想从书本开始学习,我应该从哪本书开始?我可以看到流行的是"Hadoop:确切的指南-O‘’Reilly“和”Dummies的大数据“。(我要求从初学者的水平)。
请帮助解决我的疑虑。你的建议将帮助我作出决定。
发布于 2014-01-10 21:11:04
(移出评论是因为太长时间。)
为了以任何有意义的方式管理Hadoop,您需要了解(a) Hadoop是如何工作的,(b) Hadoop是如何运行其作业的,以及(c)特定于作业的调优。
我不知道“学习Apache”意味着什么;Apache是一个项目的集合体,除非您指的是web服务器本身。
“学习数据库”太宽泛了,无法使用,而且Hadoop不是数据库(HBase是)。
您不需要任何Java知识来管理基于Java的程序,尽管了解JVM选项、如何指定它们以及一般性当然是有帮助的。
有很多东西要消化,我会从很小的地方开始,比如入门书。此外,请记住,除了Hadoop之外还有其他解决方案,以及许多实际使用Hadoop的不同方法。
Kiji项目是一个让Hadoop/HBase/etc启动和运行的好方法,尽管如果您对“从头开始”做所有事情感兴趣,这不是最好的方法。
https://stackoverflow.com/questions/21054377
复制相似问题