首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用Mongodb检查小爬虫中URL的存在

用Mongodb检查小爬虫中URL的存在
EN

Stack Overflow用户
提问于 2015-02-02 11:42:34
回答 1查看 74关注 0票数 0

我使用MongoDB在一个小型爬虫中索引URL。我的爬虫中最大的URL数量大约是5亿个URL。我想在URLdb中搜索以检查现有的URL,但是对于这个查询,搜索中的MongoDB速度非常低:

代码语言:javascript
复制
db.hosts.find({URL:"http://myhost.com"})

我的问题是:

  1. 如何提高MongoDB中的搜索速度?
  2. 就我而言,Lucene比MongoDB好吗?
EN

回答 1

Stack Overflow用户

发布于 2015-02-02 13:13:07

  1. 在文档中可以很好地确定,提高查询性能的方法是在要查询的字段中添加索引
  2. 关于您正在做的事情的信息量不足以让任何人知道Lucene是否会比MongoDB更好。

另外,如果您正在搜索您的URL以寻找一个现有的URL,这样您就不会添加一个重复的URL,那么您想要的就是创建唯一索引

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28277013

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档