在查找Hadoop的python客户端时,我发现了两个模块pydoop和hadoopy。这两者似乎都足够好使用,但不确定哪一个比另一个有更多的优势安装一个。
发布于 2014-02-13 16:45:10
我认为最全面的文档是http://blog.cloudera.com/blog/2013/01/a-guide-to-python-frameworks-for-hadoop/。
最近,我真的认为马约伯作为一个明显的领跑者而领先。它有一个非常活跃的邮件列表,它似乎是相对稳定和最新的。它还与Amazon有很好的集成。
https://stackoverflow.com/questions/21754728
复制相似问题