是否有内置的机制可以标记HDFS文件的额外元数据,并根据标记的信息检索文件?比方说,如果我想向数据中添加企业级信息,是否可以在Hadoop中实现,或者我们是否需要其他框架
发布于 2015-05-21 14:03:07
这可能对你有用。
QueryIO提供了高级的手动和自动数据标记功能,允许您在文件写入HDFS时定义文件的属性。它自动存储存储在HDFS中的基本MetaData文件,并通过允许您定义额外的MetaData来进一步扩展MetaData层。它支持数十种文件格式,如pdf/xls/doc文件格式、图像文件、音频和视频文件等。
http://www.slideshare.net/QueryIO/hadoop-data-tagging-and-metadata-extension
https://stackoverflow.com/questions/30363920
复制相似问题