我是Protobuf和Hive的新手。我正在尝试将protobuf存储在Hive中,并且我的protobuf中的新行似乎遇到了问题。我看到用户Griffin已经成功地做到了这一点。
Custom inputformat to process protobufs in hadoop 0.20
你能给我更多关于这方面的细节吗?我已经尝试过ElephantBird和Hive-protobuf,它们都可以与序列文件一起使用,但我的protobuf没有序列文件格式。
发布于 2013-01-16 06:04:27
Hive-protobuf确实为我处理了这种情况。在没有其他选择的情况下,我不得不将protobufs转换为Sequencefiles,现在我可以使用Hive SerDe了。
https://stackoverflow.com/questions/12712825
复制相似问题