Hadoop用于处理大数据,hadoop使用HBase作为其数据库,但BigData可能80%是非结构化的,HBase只存储结构化数据。
非结构化数据存储在哪里?或者是否有hadoop工具将非结构化数据转换为结构化格式?
发布于 2018-10-20 15:24:59
“大数据”并不意味着任何结构的存在,但是大多数数据集是半结构化的,否则很难一致地解析。
HBase位于HDFS之上。Hbase可以存储二进制blobs,因此它的数据可以用来存储非结构化数据。
HDFS可以存储任何类型的数据。它没有关于文件内容的元数据。
通常使用Hive (MetaStore)应用HDFS数据集的结构。
https://stackoverflow.com/questions/52904354
复制相似问题