我正在使用PySolr运行我的搜索。我想索引一个rss feed,想知道这是否可能使用PySolr,如果是的话,你怎么做。
我在http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example的Solr中找到了关于如何做到这一点的说明
但是我找不到任何关于如何在PySolr中做同样事情的东西
谢谢
发布于 2010-01-29 06:33:31
您可能不需要在PySolr中执行相同的操作。如果已经让Solr对提要进行索引,那么只需使用PySolr来查询该索引即可。类似于:
from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
do_stuff_with(result)如果你真的想从Python端来做这件事,那么你需要在那里获取和解析RSS (使用其他库,例如Universal Feed Parser);PySolr只是包装了与Solr的交互,它并不“做”数据源。
您可能想看看Haystack,它使用PySolr (并且可以使用其他引擎),并且巧妙地抽象了创建搜索索引项的工作,并将它们发送到Solr进行索引。
https://stackoverflow.com/questions/2140029
复制相似问题