我有以下场景。将维度表加载到SQL Server 2016中。将事实表(例如ORDER_ITEM )加载到Hadoop中。我想跨产品和ORDER_ITEM运行聚合查询,例如
SELECT
PRODUCT.PRODUCT_CATEGORY,
SUM(ORDER_ITEM.AMOUNT)
FROM
HADOOP.ORDER_ITEM OI
JOIN RDBMS.PRODUCT P ON (OI.PRODUCT_ID = P.PRODUCT_ID)
GROUP BY
PRODUCT.PRODUCT_CATEGORY这是什么行为。(1) Polybase是否将产品维度广播到Hadoop中,在那里执行连接和聚合,并返回结果(2) Polybase是否将ORDER_ITEM表广播到SQL Server,并在那里执行连接和聚合?
可能是(2),但如果有人尝试过,请让我知道
发布于 2017-11-03 01:44:39
无论数据量是多少,PolyBase从不从SQL Server中移动数据。根据统计数据,PolyBase将:
A)将order_item表流送回SQL Server,并计算连接并聚合数据。
B)按OI.ProductiD下推部分聚合和(Order_Item.Amount)组,将结果集流式传输到SQL Server,然后在SQL Server中进行连接和最终聚合。
https://stackoverflow.com/questions/45616027
复制相似问题