我很好奇,因为当我们使用spark -e运行查询时,查询在哪里执行。
spark-sql -e "SELECT count(*) FROM table"而且,当我们计算时,这个动作是否只在驾驶员身上调用?
发布于 2022-02-11 12:36:45
行动意味着做些什么。该操作来自驱动程序,工作分发给执行程序针对分区运行任务的Worker。
所以,计数发生在执行者身上。将用于计数分区的执行器的部分计数结果发送到-并在驱动程序上进行聚合。
https://stackoverflow.com/questions/71080167
复制相似问题