来自:https://support.google.com/webmasters/answer/1061943?hl=en
下表显示了Google各种产品和服务使用的爬虫:

问题
从上面的节选中我们可以看到,可以在robots.txt文件中使用用户代理令牌进行匹配,从而检测爬虫。
我想使用我的服务器上的用户代理令牌来检测Googlebot爬虫请求。因此,我不必硬编码完全用户代理字符串。
但是,用户代理令牌是否存在于request headers中?是否可以使用它,还是应该坚持使用完全用户代理字符串?
发布于 2019-10-28 08:44:45
如果您比较“用户代理令牌”和“完整用户代理字符串”列上的值,您可以看到“完全用户代理字符串”中也有“产品令牌”。因此,您可以检查“完整用户代理字符串”是否包含“用户代理令牌”。
未来,“完全用户代理字符串”上的数字将比"produkt令牌“更频繁地发生变化。
https://stackoverflow.com/questions/58587708
复制相似问题