首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >apache-beam/google-云数据流中的排序和限制

apache-beam/google-云数据流中的排序和限制
EN

Stack Overflow用户
提问于 2019-03-13 14:45:07
回答 1查看 890关注 0票数 0

让我们假设我有以下格式的PCollection:

代码语言:javascript
复制
-----------------------------------------
|   sale_id |   product_id  |   amount  |
|-----------|---------------|-----------|
|     1     |       a       |     1     |
|-----------|---------------|-----------|
|     2     |       b       |     12    |
|-----------|---------------|-----------|
|     3     |       c       |     3     |
|-----------|---------------|-----------|
|     4     |       d       |     100   |
|-----------|---------------|-----------|
|     5     |       e       |     4     |
-----------------------------------------

我的目标是只过滤X的畅销书记录,即按数量排序,限制X

在apache beam中是如何做到的呢?

谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-03-13 19:53:11

更新:

如果您想尝试的话,BeamSQL2支持“按限制订购”。

如果您使用的是Java,则可以使用内置的顶级transform1按限制进行排序。顶变换允许DESC和ASC。

如果您使用的是没有TOP的SDK,则始终可以参考TOP的实现来编写您自己的SDK。

1:https://github.com/apache/beam/blob/master/sdks/java/core/src/main/java/org/apache/beam/sdk/transforms/Top.java

2.https://beam.apache.org/documentation/dsls/sql/overview/

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55144662

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档