我真的很有兴趣让我的GP基于开发这样的页面排名算法,而不是建立我自己的搜索引擎。
有没有办法在没有搜索引擎的情况下测试我的算法?
发布于 2012-10-14 09:56:16
假设您有兴趣在web上测试它,因为从PageRank的角度来看,大多数非web数据集都不是那么有趣:
commoncrawl.org有一个网络爬虫,你可以在亚马逊网络服务中以相对较低的成本进行处理;这可能会在这个过程中省去很多工作。
https://stackoverflow.com/questions/12877980
复制相似问题