腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(93)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
3
回答
为什么部署腾讯云CDN加速以后,
百度
蜘蛛
就抓取不了了?
内容分发网络 CDN
[图片][图片]
浏览 1817
提问于2018-02-27
1
回答
如何在网站上为不同的
蜘蛛
设置不同的语言?
有没有办法根据搜索引擎
蜘蛛
设置语言?例如: 用俄语显示网站上的燕德龙
蜘蛛
?
浏览 2
提问于2012-01-16
得票数 1
2
回答
是否有可能减慢白鲸爬行的频率?
百度
蜘蛛
爬行的频率已经做了很多。这是真的:“白鹭像疯子一样爬行”我想把这些访问保留在我的站点上,尽管它们很少(也许有一天它们会增长?)上述问题的公认答案表明,
百度
网站管理员工具提供了限制爬行率的机会,但我不愿公开(只有中文的)蠕虫罐头。 有没有人有过限制BWT爬行率的经验?还有别的方法来限制这个负荷吗?
浏览 0
修改于2017-04-13
得票数 19
1
回答
百度
蜘蛛
每天造成3Gb的流量,但我在中国做生意。
我在一个困难的情况下,
百度
蜘蛛
击中我的网站造成了大约3Gb的带宽价值一天。同时,我在中国做生意,所以我不想就这么阻止它。 有没有其他人遇到过类似的情况(有
蜘蛛
)?你遇到了一个神奇的解决方案吗?
浏览 0
提问于2015-11-24
得票数 3
4
回答
开启CDN加速以后…
百度
蜘蛛
抓取403,该如何解决?
内容分发网络 CDN
如题,源站跟
百度
都说不是他们的原因,我设置的也没有问题,还专门咨询过腾讯的客服,他们教我设置的,现在就是抓取403 ,用户可以正常访问,用其他的模拟
蜘蛛
抓取都没有问题…所以我该怎么办呢?
浏览 1849
提问于2018-03-01
1
回答
现在封锁搜索引擎的未来意味着什么?
此前,一个问题曾在该网站上询问
百度
的过度爬行倾向,一名用户评论:这句话背后的逻辑是什么,它是否成立?
浏览 0
修改于2017-04-13
得票数 1
回答已采纳
1
回答
带有反向代理和静态的Microsoft IIS规则
我有一个IIS,它最初在www.root中托管静态HTML,但后来我们决定,如果一个
百度
蜘蛛
试图爬行,我们将把流量映射到我们的NuxtJS服务器旁边,它也在IIS旁边运行。因此,我们安装了ARR (Application请求路由)以启用反向代理,它运行良好,现在我们尝试首先测试在URL重写入站规则中的哪些地方: 如果
百度
蜘蛛
将请求映射到NuxtJS服务器(http://localhost
浏览 0
修改于2020-07-24
得票数 2
回答已采纳
1
回答
使用.htaccess阻止Yandex、
百度
和MJ12bot
我厌倦了燕麦,
百度
和MJ12bot吃了我所有的带宽。他们甚至都不关心无用的robots.txt文件。 我也想阻止任何有“
蜘蛛
”字的用户代理。
浏览 0
提问于2016-02-26
得票数 4
回答已采纳
1
回答
百度
搜索
蜘蛛
明白Javascript吗?
更具体地说,如果/有多好的
百度
搜索爬虫索引- 我已经看过他们的文档和,但是找不到一个“作为
百度
机器人的视图”工具(比如谷歌和必应
浏览 4
提问于2014-10-15
得票数 1
回答已采纳
1
回答
百度
蜘蛛
不服从DNS TTL
今天是第三天,旧服务器上的访问日志显示
百度
蜘蛛
的点击量。我使用AWS Router53进行DNS。
浏览 0
提问于2014-04-19
得票数 1
回答已采纳
1
回答
蜘蛛
能在所有管道通过后得到物品吗?
蜘蛛
项目转到管道(多个管道) 我的问题是。return item(在
蜘蛛
中)是没有
意义
的,功能是完成的。 我想让所有物品都通过管道。
浏览 2
修改于2018-12-26
得票数 0
1
回答
百度
蜘蛛
会理解无限滚动的页面吗?
因此,我的问题是:
百度
的爬虫(
百度
的爬虫)是否足够聪明,能够理解无止境的JavaScript分页,就像谷歌的机器人显然能做到的那样?
浏览 0
修改于2015-12-05
得票数 2
回答已采纳
1
回答
同一个URL中的多个重写规则
请注意,在我的第一个条件下,如果
百度
蜘蛛
爬行我们的网站,我将尝试将请求映射到NuxtJS,否则只需在the根目录上提供静态HTML文件即可。 <?
浏览 0
修改于2020-07-24
得票数 0
回答已采纳
1
回答
针对大量请求的刮擦模式
最简单的方法是为每个类别创建一个
蜘蛛
,并为每个下一篇文章链接创建一个yield响应以进行进一步提取。这有
意义
吗?或者你可以
浏览 3
修改于2016-05-02
得票数 0
回答已采纳
2
回答
百度
网络搜索引擎API
英文版的
百度
没有关于如何获得或使用他们的API的有
意义
的信息。我试着写了几封电子邮件,但到目前为止还没有回复。谷歌翻译试图翻译中文版本,但没有成功。
浏览 2
提问于2013-12-02
得票数 3
1
回答
如何在windows 10命令提示符中使用Spyder(anaconda3)的路径
我使用Spyder(anaconda3)来完成我的大部分python工作,我可以直接从
蜘蛛
控制台使用pip安装,但不能从windows 10命令提示符使用pip安装。是否有一种方法可以从
蜘蛛
/anaconda程序直接使用命令提示符进行pip安装?这是否是严格必要的,甚至是有用的,
蜘蛛
控制台能够处理所有所需的东西(甚至非python注入),而不需要使用windows comand提示符吗?例如,如果我要运行在
蜘蛛
控制台上,这是一个问题还是在命令提示符下运行它更有<em
浏览 2
提问于2021-10-17
得票数 0
回答已采纳
2
回答
从另一个文件中搜索单词
bots.txt:包含
蜘蛛
和爬虫名称,每个名称位于不同的行中,例如: googlebot、mj12bot、
百度
等。
浏览 2
提问于2013-05-13
得票数 0
回答已采纳
3
回答
重命名刮伤项目
我想重命名我的Scrapy项目,
蜘蛛
制作,JSON创建,但希望更改名称有
意义
的东西,而不搞砸任何事情。 通过终端的解决方案也将受到赞赏。
浏览 0
修改于2019-08-18
得票数 3
回答已采纳
1
回答
如何正确动态生成robots.txt?
一些爬虫可以正确访问路由,但无法检测到它(例如,
百度
蜘蛛
)。
浏览 24
修改于2021-09-19
得票数 0
1
回答
刮除:禁用对表单请求的筛选是否有
意义
?
所以我一直在想关于一个
蜘蛛
,也许我的一些请求可能被过滤了,因为它们是到url端点的,但是有不同的body参数(表单数据)。dont_filter=True对FormRequest对象有
意义
吗?
浏览 1
提问于2014-12-22
得票数 1
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
点击加载更多
领券