网络上有一些信息表明Mahout的XMLInputFormat可以用来在hadoop上高效地处理XML,但我一直找不到一个如何工作的例子。谁能给我指个方向?
我正在使用Cascalog/Clojure。
发布于 2014-03-11 15:07:38
只需看一下使用记录读取器的hadoop实现来读取xml文件:
http://javatute.com/javatute/faces/post/hadoop/2014/reading-simple-xml-file-using-hadoop.xhtml
https://stackoverflow.com/questions/17735063
复制相似问题