我创建了一个名为Element的类，并将csv的每一行转换为一个RDDElement。然后，我创建了一个名为QuadNode的可序列化类，该类有一个ListElements和一个大小为4的ArrayString。在向节点添加元素时，这些元素将被添加到节点的列表中。如果列表获得的元素超过X个(在我的示例中为20个)，节点将分解为4个子节点，并将这些元素发送给子节点。最后，我创建了一个类QuadTree，它的rest属性中有一个RDDQuadNodes。每次节点分解为子节点时，这些子节点就会被添加到树的RDD中。

在非函数式语言中，每个节点将有4个指针，每个子节点一个。因为我们是在分布式环境中，所以这种方法不能工作。因此，我为每个节点分配了一个唯一的Id。根节点的id = "0“。Root的节点ids为"00“、"01”、"02“和"03”。Node-"00“子节点的ids为"000”、"001“、"002”、"003“。这样，如果我们想要找到一个节点的所有后代，我们可以通过检查节点的id是否startWith出节点id来过滤树的RDDQuadNode。颠倒这个逻辑可以帮助我们找到一个节点的父节点。

这就是我实现QuadTree的方式，至少现在是这样。如果有人知道实现这一点的更好方法，我很想听听他/她的意见。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53217516

复制

相似问题

问Apache Spark -实现分布式QuadTree
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Apache Spark -实现分布式QuadTreeEN