首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Polybase中的下推

Polybase中的下推
EN

Stack Overflow用户
提问于 2017-08-10 22:05:49
回答 1查看 262关注 0票数 0

我有以下场景。将维度表加载到SQL Server 2016中。将事实表(例如ORDER_ITEM )加载到Hadoop中。我想跨产品和ORDER_ITEM运行聚合查询,例如

代码语言:javascript
复制
SELECT
 PRODUCT.PRODUCT_CATEGORY,
 SUM(ORDER_ITEM.AMOUNT)
FROM
 HADOOP.ORDER_ITEM OI
 JOIN RDBMS.PRODUCT P ON (OI.PRODUCT_ID = P.PRODUCT_ID)
GROUP BY
  PRODUCT.PRODUCT_CATEGORY

这是什么行为。(1) Polybase是否将产品维度广播到Hadoop中,在那里执行连接和聚合,并返回结果(2) Polybase是否将ORDER_ITEM表广播到SQL Server,并在那里执行连接和聚合?

可能是(2),但如果有人尝试过,请让我知道

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-11-03 01:44:39

无论数据量是多少,PolyBase从不从SQL Server中移动数据。根据统计数据,PolyBase将:

A)将order_item表流送回SQL Server,并计算连接并聚合数据。

B)按OI.ProductiD下推部分聚合和(Order_Item.Amount)组,将结果集流式传输到SQL Server,然后在SQL Server中进行连接和最终聚合。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45616027

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档