首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Spark - Kudu谓词下推

Spark - Kudu谓词下推
EN

Stack Overflow用户
提问于 2019-10-30 05:42:21
回答 1查看 300关注 0票数 0

我使用kudu和spark streaming作为实时仪表板,我的问题是,当我使用kudu表连接spark streaming中的批处理时,它不会对其进行谓词下推,并且需要2-3秒来获取整个spark表,然后对其进行过滤。有什么办法可以避免这种情况吗?

谢谢,

Alexandru

EN

回答 1

Stack Overflow用户

发布于 2019-11-13 11:27:04

1.Kudu是一个列式存储引擎,您可以选择need.It哪一列可以减少从kudu拉取的数据。

2.kudu谓词下推支持>、<、>=、<=、=、BETWEEN或IN在从kudu.And谓词下推可能触发的过滤数据之后,您可能可以缓存数据。

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58615827

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档