我有以下嵌套的JSON格式数据存储为syslog,我需要使用HiveQL查询这些数据,并将其转换为CSV文件(用于显示图形):
"logAggregate": {"name-1":{"time":"74","count":"1"},"name-2":{"time":"2","count":"1"},"name-3 {"time":"2","count":"5"},"name-4":{"time":"22","count":"1"},
。
。
。// and so on..
。}我正在寻找的输出格式如下所示:
name-1 time
name-2 time
name-3 time
.
.
. // so on我对Hive比较陌生,所以不确定我应该如何解析这个JSON数据。我试着摆弄侧视图和json_tuple,但徒劳无功!
任何帮助都将是非常宝贵的!
发布于 2014-06-19 07:02:10
看看这篇博客文章( http://brickhouseconfessions.wordpress.com/2014/02/07/hive-and-json-made-simple/ ),它描述了如何使用Brickhouse ( http://github.com/klout/brickhouse )中提供的JSON UDF。
对于您的特定情况,您可能希望解析为地图,然后在地图上执行分解。
SELECT key,
map_index( value, "time") as time_value
FROM my_table
LATERAL VIEW explode_map( from_json( json, 'map<map<string,string>>') ) kv1 as k, v;https://stackoverflow.com/questions/24280516
复制相似问题