我是nutch和solr的新人。我使用nutch爬行网站,我使用solr索引这些网页。是否有方法检索solr数据库中链接的内容?
例如
谢谢
达尼洛
发布于 2013-10-17 19:11:25
页面文本存储在一个名为"content“的字段中。请注意,这不是原始页面,而是页面的解析版本。可搜索的内容应该出现在这里,而不是像元标记和javascript这样的东西。
https://stackoverflow.com/questions/19428500
相似问题