首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在特定站点上创建搜索引擎并收集特定信息

在特定站点上创建搜索引擎并收集特定信息
EN

Stack Overflow用户
提问于 2014-04-06 23:22:29
回答 2查看 1.8K关注 0票数 1

我需要创建一个搜索引擎,通过一个网站列表,并在那里搜索一个查询,而这些网站都返回一些不同的格式和结构的数据,我需要收集特定的信息(在一个独特的结构)从所有这些网站。

有什么方法,我可以这样做,与现有的引擎,如谷歌自定义搜索引擎?还是我最好自己创造一个?如果是的话,我应该采取的第一步是学习如何有效地索引和搜索这些网站,而不是用无用的垃圾填满我的服务器。

总之,除了在这些网站的搜索框上搜索一个查询之外,我还需要对每个网站的搜索结果进行适当的处理,并将其放在一个地方的一个联合结构中。所有的结果都将被解析并提取到4-6个字段中(当然,除非,谷歌CSE有办法做到这一点。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-04-07 21:10:28

Google为标准的Google搜索提供了一些接口。您可以控制用户界面和搜索参数,但无法控制索引,也不能直接访问索引数据。

您可能对GAE提供的Google更感兴趣。这些是完全不同的:它们是搜索服务,您可以在其中提供数据并控制索引。

票数 1
EN

Stack Overflow用户

发布于 2018-12-26 21:57:22

2018年12月,在谷歌CSE的帮助下,我们可以定义一套网站,我们可以在那里完成我们的请求。谷歌CSE提供了多达2000的网站来源,包括和多达5000源的整体。

一个简单的比较:

  • Google提供了一个强大的API、自定义请求,并且在您的服务器上不运行任何东西,但是相反,它每天只允许100个请求免费使用。
  • 开发一个新的SE可以帮助小型网站,它为业务需求提供了一个定制的SE,但它需要:时间、基础设施、金钱投资、SE算法的开发:索引、存储和分析。

要而论之。这取决于你真正需要它的哪一边。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22901263

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档