问Spark - Kudu谓词下推
EN

Stack Overflow用户

提问于 2019-10-30 05:42:21

回答 1查看 300关注 0票数 0

我使用kudu和spark streaming作为实时仪表板，我的问题是，当我使用kudu表连接spark streaming中的批处理时，它不会对其进行谓词下推，并且需要2-3秒来获取整个spark表，然后对其进行过滤。有什么办法可以避免这种情况吗？

谢谢,

Alexandru

发布于 2019-11-13 11:27:04

1.Kudu是一个列式存储引擎，您可以选择need.It哪一列可以减少从kudu拉取的数据。

2.kudu谓词下推支持>、<、>=、<=、=、BETWEEN或IN在从kudu.And谓词下推可能触发的过滤数据之后，您可能可以缓存数据。

票数 -1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58615827

复制

相似问题

问Spark - Kudu谓词下推EN