基本上,我有一个电话号码(带有相关信息,如时间和日期)的呼入和呼出的电子表格,这构成了一个“网络”。然后,我有了第二个电话号码的呼入和呼出的电子表格,这构成了第二个“网络”。(对于第三个电话号码,我可能也有相同的号码,但我正在等待。)
我感兴趣的是找到一种方法来度量两个或更多这些称为“网络”的相似性/重叠,并好奇是否存在任何度量/统计数据。(如果您可以指出任何文献或其他资源,证明该方法被广泛使用/可信,我将加倍感激!)
发布于 2017-05-25 04:54:34
你所描述的似乎是一张图表。
您可以让图的每个节点都是一个电话号码,每个边都是一个呼叫。
您可以在图中执行许多操作,例如确定两个节点是否通过其他节点直接或间接连接,以及如何连接。
您还可以识别“连接的组件”,即相互连接的节点组,以及许多其他操作。
如果您不希望推出自己的解决方案,您可以使用图形数据库。Neo4J就是属于这一类的产品。
https://stackoverflow.com/questions/44168140
复制相似问题