我感兴趣的是寻找一些真实世界的海量数据集(>=1M),这些数据集需要进行拓扑排序。也许是与生物信息学有关的东西?
发布于 2017-09-12 17:54:58
你看过Stanford Large Network Dataset Collection了吗?有很多现实世界的数据集,也有很大的数据集,其中许多是定向的。
发布于 2017-09-15 16:56:16
在Linux git历史中有650k commits;对单独的提交执行拓扑排序可能有重新发现分支(合并或不合并)的合理目的。
您可以通过包含其他Git对象类型(标记、树和blobs)将其扩展到超过一百万个对象:然后,拓扑排序将重新构建目录层次结构以及提交历史记录。
https://stackoverflow.com/questions/44489821
复制相似问题