我试图使用MySql和PutHiveQl处理器将数据从QueryDatabaseTable导入到Hive,但是会发生错误。
我有一些问题:
puthiveql的输出格式是什么?发布于 2016-07-15 18:45:37
以下是有关您的问题的一些信息:
QueryDatabaseTable -> ConvertAvroToJSON -> SplitJson -> EvaluateJsonPath -> UpdateAttribute (可选) -> ReplaceText -> PutHiveQL
在NiFi 1.0中,将有一个ConvertAvroToORC处理器,这是将数据输入到Hive (以及从Hive查询数据)的一种更有效的方法。这种方法是将QueryDatabaseTable的结果转换为ORC文件,然后将这些文件放在HDFS中(使用PutHDFS),并生成一个部分Hive语句来为您创建表(使用来自Avro记录的类型信息)。将该语句(在填写目标位置后)传递给PutHiveQL,然后立即开始查询您的表。
还计划使用一个以Avro记录作为输入的PutHiveStreaming处理器,这样流就只是QueryDatabaseTable -> PutHiveStreaming,它将直接将记录插入到Hive中(并且比多个insert语句高效得多)。
https://stackoverflow.com/questions/38402140
复制相似问题