文章/答案/技术大牛

发布

社区首页 >问答首页 >如何用DSE图处理超级节点

问如何用DSE图处理超级节点
EN

Stack Overflow用户

提问于 2018-01-04 09:42:49

回答 1查看 224关注 0票数 2

我有一个简单的顶点“url”

schema.vertexLabel('url').partitionKey('url_fingerprint', 'prop1').properties("url_complete").ifNotExists().create()

还有一个叫做“链接”的edgeLabel，它将一个url连接到另一个url。

schema.edgeLabel('links').properties("prop1", 'prop2').connection('url', 'url').ifNotExists().create()

有可能一个网址有数以百万计的传入链接(例如，来自所有子页的ebay.com首页)。

但这似乎会导致真正的大分区/和崩溃的dse，因为广泛的分区(来自Opscenter宽分区报告)：graphdbname.url_e (2284mb)

我怎样才能避免这种情况？如何处理这个“超级节点”？我已经为标签找到了一个“分区”命令(关于这个1的文章)，但是这个命令是不推荐的，它将在DSE 6.0中删除/发布说明中唯一的提示就是用另一种方式对数据建模--但我不知道在这种情况下如何做到这一点。

我对每一个提示都很高兴。谢谢!

datastax

graph-databases

datastax-enterprise

datastax-enterprise-graph

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-01-10 17:48:07

当前的建议是使用在C*世界中驱动数据模型设计的“桶”概念，并通过创建一个表示链接组的中间顶点将其应用于图形。

2个顶点标号

URL
URL_Group /分区密钥((url，group))…即具有两个分区关键组件的复合主键

2边

URL -> URL_Group
URL_Group (替换现有的自参考边) URL_Group <->URL_Group每个组不超过100 than url_fingerprints。在每个100 each边存在之后创建一个新组。

此解决方案需要簿记以确定何时需要新组。这可以通过一个简单的C*表来完成，这样可以快速、容易地检索。

CREATE TABLE lookup url_fingerprint, group,  count counter PRIMARY KEY (url_fingerprint, group)

这应保持DESC顺序，如果DESC顺序未被保留，则可能需要按语句添加订单。

在写入图表之前，需要阅读表才能找到最新的组。

SELECT url_fingerprint, group, count from lookup LIMIT(1)

如果计数器>100 group，则创建一个新组(增量组+1)。在将新行写入图形期间或之后，需要增加计数器。

遍历将需要类似于：

g.V().has(some url).out(URL).out(URL_Group).in(URL)

在概念上，您将遍历像URL -> URL_Group->URL_Group<-URL这样的关系。

这种类型的遍历的可视化模型如下图所示

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/48092495

复制

相似问题

问如何用DSE图处理超级节点
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何用DSE图处理超级节点EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何用DSE图处理超级节点
EN