腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
3
回答
为什么部署腾讯云CDN加速以后,
百度
蜘蛛
就抓取不了了?
内容分发网络 CDN
[图片][图片]
浏览 1817
提问于2018-02-27
1
回答
如何在网站上为不同的
蜘蛛
设置不同的语言?
有没有办法根据搜索引擎
蜘蛛
设置语言?例如: 用俄语显示网站上的燕德龙
蜘蛛
?
浏览 2
提问于2012-01-16
得票数 1
2
回答
是否有可能减慢白鲸爬行的频率?
百度
蜘蛛
爬行的频率已经做了很多。这是真的:“白鹭像疯子一样爬行”我想把这些访问保留在我的站点上,尽管它们很少(也许有一天它们会增长?)上述问题的公认答案表明,
百度
网站管理员工具提供了限制爬行率的机会,但我不愿公开(只有中文的)蠕虫罐头。 有没有人有过限制BWT爬行率的经验?还有别的方法来限制这个负荷吗?
浏览 0
修改于2017-04-13
得票数 19
1
回答
百度
蜘蛛
每天造成3Gb的流量,但我在中国做生意。
我在一个困难的情况下,
百度
蜘蛛
击中我的网站造成了大约3Gb的带宽价值一天。同时,我在中国做生意,所以我不想就这么阻止它。 有没有其他人遇到过类似的情况(有
蜘蛛
)?你遇到了一个神奇的解决方案吗?
浏览 0
提问于2015-11-24
得票数 3
4
回答
开启CDN加速以后…
百度
蜘蛛
抓取403,该如何解决?
内容分发网络 CDN
如题,源站跟
百度
都说不是他们的原因,我设置的也没有问题,还专门咨询过腾讯的客服,他们教我设置的,现在就是抓取403 ,用户可以正常访问,用其他的模拟
蜘蛛
抓取都没有问题…所以我该怎么办呢?
浏览 1849
提问于2018-03-01
1
回答
现在封锁搜索引擎的未来意味着什么?
此前,一个问题曾在该网站上询问
百度
的过度爬行倾向,一名用户评论:这句话背后的逻辑是什么,它是否成立?
浏览 0
修改于2017-04-13
得票数 1
回答已采纳
1
回答
带有反向代理和静态的Microsoft IIS规则
我有一个IIS,它最初在www.root中托管静态HTML,但后来我们决定,如果一个
百度
蜘蛛
试图爬行,我们将把流量映射到我们的NuxtJS服务器旁边,它也在IIS旁边运行。因此,我们安装了ARR (Application请求路由)以启用反向代理,它运行良好,现在我们尝试首先测试在URL重写入站规则中的哪些地方: 如果
百度
蜘蛛
将请求映射到NuxtJS服务器(http://localhost
浏览 0
修改于2020-07-24
得票数 2
回答已采纳
1
回答
使用.htaccess阻止Yandex、
百度
和MJ12bot
我厌倦了燕麦,
百度
和MJ12bot吃了我所有的带宽。他们甚至都不关心无用的robots.txt文件。 我也想阻止任何有“
蜘蛛
”字的用户代理。
浏览 0
提问于2016-02-26
得票数 4
回答已采纳
1
回答
百度
蜘蛛
不服从DNS TTL
今天是第三天,旧服务器上的访问日志显示
百度
蜘蛛
的点击量。我使用AWS Router53进行DNS。
浏览 0
提问于2014-04-19
得票数 1
回答已采纳
1
回答
百度
搜索
蜘蛛
明白Javascript吗?
更具体地说,如果/有多好的
百度
搜索爬虫索引- 我已经看过他们的文档和,但是找不到一个“作为
百度
机器人的视图”工具(比如谷歌和必应
浏览 4
提问于2014-10-15
得票数 1
回答已采纳
1
回答
针对大量请求的刮擦模式
我需要刮大的网站,大约有
10
个类别和数千(我真的不知道多少)的文章在每个类别。最简单的方法是为每个类别创建一个
蜘蛛
,并为每个下一篇文章链接创建一个yield响应以进行进一步提取。我想的是制作一个顶级
蜘蛛
,它可以从类别中提取文章urls到队列中。然后,第二级(文章)
蜘蛛
应该从队列中接收每一个固定数量的urls (比如100个),并且当
蜘蛛
完成时,另一个urls将被启动。以这种方式,我们可以控制很多
蜘蛛
,这是一个常数,比如说20b)我们可以选择预先计算文章的数量,c)
蜘蛛
的
浏览 3
修改于2016-05-02
得票数 0
回答已采纳
1
回答
如何在windows
10
命令提示符中使用Spyder(anaconda3)的路径
我使用Spyder(anaconda3)来完成我的大部分python工作,我可以直接从
蜘蛛
控制台使用pip安装,但不能从windows
10
命令提示符使用pip安装。是否有一种方法可以从
蜘蛛
/anaconda程序直接使用命令提示符进行pip安装?这是否是严格必要的,甚至是有用的,
蜘蛛
控制台能够处理所有所需的东西(甚至非python注入),而不需要使用windows comand提示符吗?例如,如果我要运行在
蜘蛛
控制台上,这是一个问题还是在命令提示符
浏览 2
提问于2021-10-17
得票数 0
回答已采纳
1
回答
蜘蛛
能在所有管道通过后得到物品吗?
蜘蛛
项目转到管道(多个管道) 我的问题是。return item(在
蜘蛛
中)是没有
意义
的,功能是完成的。 我想让所有物品都通过管道。
浏览 2
修改于2018-12-26
得票数 0
1
回答
百度
蜘蛛
会理解无限滚动的页面吗?
因此,我的问题是:
百度
的爬虫(
百度
的爬虫)是否足够聪明,能够理解无止境的JavaScript分页,就像谷歌的机器人显然能做到的那样?
浏览 0
修改于2015-12-05
得票数 2
回答已采纳
1
回答
同一个URL中的多个重写规则
请注意,在我的第一个条件下,如果
百度
蜘蛛
爬行我们的网站,我将尝试将请求映射到NuxtJS,否则只需在the根目录上提供静态HTML文件即可。 <?
浏览 0
修改于2020-07-24
得票数 0
回答已采纳
1
回答
百度
站点地图文件爬行失败
我已经向中文
百度
提交了我的网站的站点地图文件。1)使用gzip压缩的 16 sitemap文件,每个文件小于
10
16,包含更少的50K url。我看到的是
百度
非常奇怪的行为--它将我的一些站点地图文件标记为Failed (抓取失败),而其他文件似乎是经过处理的(正常--正常)。除了
百度
留言“失败的爬虫”(抓取失败)之外,我找不到我的站点地图有什么问题。谁能提出什么是错的?或者哪里可以看到准确的错误信息,从
百度
浏览 3
提问于2016-10-18
得票数 0
回答已采纳
2
回答
百度
网络搜索引擎API
英文版的
百度
没有关于如何获得或使用他们的API的有
意义
的信息。我试着写了几封电子邮件,但到目前为止还没有回复。谷歌翻译试图翻译中文版本,但没有成功。
浏览 2
提问于2013-12-02
得票数 3
1
回答
运行刮除
蜘蛛
的多个进程
我的
蜘蛛
已经完全工作了。SELECT COUNT(*) FROM product_ids,然后除以
10
,然后执行我有一个想法,我可以在终端中通过在刮擦命令中传递但是我想在
蜘蛛
里做,所以我只运行了一次
蜘蛛
,然后它在
蜘蛛
体内运行了
10
个相同的
蜘蛛
。
浏览 0
提问于2016-10-13
得票数 1
0
回答
2023-07-31:用r、e、d三种字符,拼出一个回文子串数量等于x的字符串。 1 <= x <?
编程算法
、
百度
、
字符串
1 <= x <=
10
^5。 答案见文章,全网同名。
浏览 113
提问于2023-07-31
2
回答
如何在echarts中设置多级x轴?
我正在构建一个以日期为x轴的图表,我们使用
百度
echarts来构建它们。 在
10
-15天的范围内,我只需通过xAxis.data绘制它们,它就能正常工作。在看了网上的一些想法后,我想把它们组织成如下形式(这些天是按月份分组的,并以8-
10
天的均匀间隔分开): 2 12 22 2 12 22 2 12 22希望这是有
意义
的。
浏览 209
修改于2019-03-12
得票数 0
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券