首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >athena和合流模式注册中心

athena和合流模式注册中心
EN

Stack Overflow用户
提问于 2018-11-17 11:02:27
回答 1查看 499关注 0票数 0

我们计划将事件从Kafka卸载到S3 (例如通过使用kafka连接)。目标是拆分一个服务(例如,Athena),并在导出的avro事件之上提供一个查询接口。障碍在于Athena (使用org.apache.hadoop.hive.serde2.avro.AvroSerDe)不支持模式注册表用于存储模式id的神奇字节。您知道有什么替代方案可以与合流模式注册中心合作吗?

谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-17 20:45:58

使用S3连接的AvroConverter不会在文件中放置任何模式ID。实际上,在写入消息之后,您将完全失去模式ID。

我们有很多Hive表可以很好地处理这些文件,并且用户正在使用Athena,Presto查询。SparkSQL等

注意:如果您想使用AWS,S3连接不会(目前,5.x)提供像HDFS那样的自动Hive分区创建,所以如果您想要这样使用它,您可能需要寻找替代方法。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53350568

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档