腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(16)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
3
回答
为什么部署腾讯云CDN加速以后,
百度
蜘蛛
就抓取不了了?
内容分发网络 CDN
[图片][图片]
浏览 1817
提问于2018-02-27
1
回答
如何在网站上为不同的
蜘蛛
设置不同的语言?
有没有办法根据搜索引擎
蜘蛛
设置语言?例如: 用俄语显示网站上的燕德龙
蜘蛛
?
浏览 2
提问于2012-01-16
得票数 1
2
回答
是否有可能减慢白鲸爬行的频率?
百度
蜘蛛
爬行的频率已经做了很多。这是真的:“白鹭像疯子一样爬行”我想把这些访问保留在我的站点上,尽管它们很少(也许有一天它们会增长?)上述问题的公认答案表明,
百度
网站管理员工具提供了限制爬行率的机会,但我不愿公开(只有中文的)蠕虫罐头。 有没有人有过限制BWT爬行率的经验?还有别的方法来限制这个负荷吗?
浏览 0
修改于2017-04-13
得票数 19
1
回答
百度
蜘蛛
每天造成3Gb的流量,但我在中国做生意。
我在一个困难的情况下,
百度
蜘蛛
击中我的网站造成了大约3Gb的带宽价值一天。同时,我在中国做生意,所以我不想就这么阻止它。 有没有其他人遇到过类似的情况(有
蜘蛛
)?你遇到了一个神奇的解决方案吗?
浏览 0
提问于2015-11-24
得票数 3
4
回答
开启CDN加速以后…
百度
蜘蛛
抓取403,该如何解决?
内容分发网络 CDN
如题,源站跟
百度
都说不是他们的原因,我设置的也没有问题,还专门咨询过腾讯的客服,他们教我设置的,现在就是抓取403 ,用户可以正常访问,用其他的模拟
蜘蛛
抓取都没有问题…所以我该怎么办呢?
浏览 1849
提问于2018-03-01
1
回答
现在封锁搜索引擎的未来意味着什么?
此前,一个问题曾在该网站上询问
百度
的过度爬行倾向,一名用户评论:这句话背后的逻辑是什么,它是否成立?
浏览 0
修改于2017-04-13
得票数 1
回答已采纳
1
回答
带有反向代理和静态的Microsoft IIS规则
我有一个IIS,它最初在www.root中托管静态HTML,但后来我们决定,如果一个
百度
蜘蛛
试图爬行,我们将把流量映射到我们的NuxtJS服务器旁边,它也在IIS旁边运行。因此,我们安装了ARR (Application请求路由)以启用反向代理,它运行良好,现在我们尝试首先测试在URL重写入站规则中的哪些地方: 如果
百度
蜘蛛
将请求映射到NuxtJS服务器(http://localhost
浏览 0
修改于2020-07-24
得票数 2
回答已采纳
1
回答
使用.htaccess阻止Yandex、
百度
和MJ12bot
我厌倦了燕麦,
百度
和MJ12bot吃了我所有的带宽。他们甚至都不关心无用的robots.txt文件。 我也想阻止任何有“
蜘蛛
”字的用户代理。
浏览 0
提问于2016-02-26
得票数 4
回答已采纳
1
回答
百度
蜘蛛
不服从DNS TTL
今天是第三天,旧服务器上的访问日志显示
百度
蜘蛛
的点击量。我使用AWS Router53进行DNS。
浏览 0
提问于2014-04-19
得票数 1
回答已采纳
1
回答
百度
搜索
蜘蛛
明白Javascript吗?
更具体地说,如果/有多好的
百度
搜索爬虫索引- 我已经看过他们的文档和,但是找不到一个“作为
百度
机器人的视图”工具(比如谷歌和必应
浏览 4
提问于2014-10-15
得票数 1
回答已采纳
1
回答
百度
蜘蛛
会理解无限滚动的页面吗?
因此,我的问题是:
百度
的爬虫(
百度
的爬虫)是否足够聪明,能够理解无止境的JavaScript分页,就像谷歌的机器人显然能做到的那样?
浏览 0
修改于2015-12-05
得票数 2
回答已采纳
1
回答
同一个URL中的多个重写规则
请注意,在我的第一个条件下,如果
百度
蜘蛛
爬行我们的网站,我将尝试将请求映射到NuxtJS,否则只需在the根目录上提供静态HTML文件即可。 <?
浏览 0
修改于2020-07-24
得票数 0
回答已采纳
2
回答
从另一个文件中搜索单词
bots.txt:包含
蜘蛛
和爬虫名称,每个名称位于不同的行中,例如: googlebot、mj12bot、
百度
等。
浏览 2
提问于2013-05-13
得票数 0
回答已采纳
1
回答
如何正确动态生成robots.txt?
一些爬虫可以正确访问路由,但无法检测到它(例如,
百度
蜘蛛
)。
浏览 24
修改于2021-09-19
得票数 0
1
回答
为什么我在这些代理服务器上收到了400个坏请求?
我在GitHub上找到了以下要使用的程序:
蜘蛛
:https://4.hidemyass.com/ip-1https://4.hidemyass.com/
ip
-3 https://3.hide
浏览 1
提问于2015-11-07
得票数 0
回答已采纳
1
回答
当html有表情符号时,使用Scrapy (解析
百度
Tieba post的双面图(Lzl))无法得到正确的响应。
当我分析
百度
Tieba的帖子时,我发现如果一个帖子的复核(中文名为“楼忠楼”(楼中楼),缩写为->lzl,我会在下面提到它时使用'lzl‘)有表情符号,Scrapy不会给我一个正确的回复。有lzl,有emoji,它的不能被解析为,因为发生了错误(以及在解析函数中使用打印汤的不正确的响应): 不要有lzl,在这种情况下,没有任何东西将被打印,并且
蜘蛛
结束时没有发生错误
浏览 5
修改于2017-09-01
得票数 0
回答已采纳
领券