有没有办法定制Google Search Appliance索引HTML文档的方式?基本上,假设我有一个关键字到URL的映射,我希望索引器处理它在HTML文档中找到的关键字的出现,就像它们是指向各自URL的链接一样。
例如,如果关键字/URL映射是
ABC -> http://alpha.intra.net/beta/charlie
FOOBAR -> http://barbar.intra.net/foo
XYZ -> http://xxx.intra.net/yotta/zuul和文档是
<html><body>
Toby was talking about partnering with the folks over in ABC
on the <a href="http://proj.intra.net/tango">tango</a> project.
But I think the people over in FOOBAR would be a better fit.
</body></html>索引器会拉出:
http://alpha.intra.net/beta/charlie
http://proj.intra.net/tango
http://barbar.intra.net/foo或者,在索引之前有没有一个阶段,我可以在那里预处理HTML以插入这样的链接?
发布于 2015-07-24 03:37:39
你所要求的是不可能的。您不能告诉GSA,“如果关键字X,索引对应于X的URL -->URL”。
但是,没有什么可以阻止您在GSA和您索引的网站之间构建代理,以便您在推送到GSA的HTML文档中执行此转换。然后,您需要做的就是将GSA配置为在爬行此URL模式时使用代理服务器。
https://stackoverflow.com/questions/31595664
复制相似问题