腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(8820)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
爬虫
和
爬虫
架构
当我遇到这个设计问题时,我一直在用php构建一个刮板和
爬虫
。我想知道创建一个分离爬行和抓取任务的系统(大多数专业系统似乎都是这样做的)和一个在
爬虫
爬行时抓取任务的系统之间的权衡。
浏览 4
修改于2012-04-16
得票数 2
回答已采纳
1
回答
使用多线程改进网络
爬虫
/
爬虫
我已经开始学习网络
爬虫
,在一篇文章的帮助下,我构建了下面这个简单的
爬虫
。此外,如果您有任何其他建议或改进,请随时分享这个
爬虫
。
浏览 3
修改于2014-04-16
得票数 0
回答已采纳
1
回答
抓痕
爬虫
Scrapy 2.0.1,scrapy_crawlera 1.7.0。我认为scrapy_crawlera应该以不同的方式访问元数据()2020-04-02 06:02:36 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min) 2020-04-02 06:02:36 [officedepot] INFO: Spider o
浏览 5
提问于2020-04-02
得票数 0
5
回答
爬虫
/
爬虫
IP地址的良好来源
我在哪里可以找到
爬虫
或蜘蛛IP地址的全面列表。我需要从谷歌,雅虎,微软和其他搜索引擎,定期爬行我的网站的IP。 我不想禁用它们,因此将robots.txt文件排除在答案之外。
浏览 0
修改于2014-04-15
得票数 5
回答已采纳
4
回答
自动网络
爬虫
我正在编写一个
爬虫
,需要从许多网站获取数据。问题是每个网站都有不同的结构。我如何才能轻松地编写一个从(许多)不同网站下载(正确)数据的
爬虫
?如果网站的结构发生变化,我是否需要重写
爬虫
,或者是否有其他方法?谢谢!
浏览 0
提问于2012-07-20
得票数 1
2
回答
基于PHP的Web
爬虫
或基于JAVA的Web
爬虫
我对基于PHP的网络
爬虫
有些怀疑,它能像基于java线程的
爬虫
一样运行吗?我之所以问这个问题,是因为在java中,线程可以一次又一次地执行,我不认为PHP有类似线程的功能,你们能说一下,哪个网络
爬虫
更能充分利用吗?基于PHP的
爬虫
还是基于Java的
爬虫
浏览 1
修改于2012-12-25
得票数 0
回答已采纳
3
回答
BeautifulSoup
爬虫
解析
我正在尝试使用bs4制作一个
爬虫
,这是我要从 <html>~~ <head>...
浏览 0
修改于2018-04-12
得票数 2
回答已采纳
2
回答
爬虫
标头
我正在创建一个简单的
爬虫
,它将从预定义的站点列表中抓取。我的问题很简单:有没有
爬虫
应该特别使用的http头?什么被认为是必需的,什么是需要定义的?
浏览 3
提问于2016-11-18
得票数 2
1
回答
简易网络
爬虫
我在python中为非常简单的网络
爬虫
编写了下面的程序,但是当我运行它时,它会返回'NoneType‘对象是不可调用的,您能帮我吗?
浏览 2
修改于2012-12-01
得票数 1
1
回答
java web
爬虫
嗨,谁能推荐一个简单的java网络
爬虫
,爬行一个网站,并返回一个链接列表的网站?不,我不需要解析器。感谢您的关注。
浏览 2
提问于2011-03-01
得票数 0
1
回答
Gevent链接
爬虫
在这里,我使用python和漂亮的汤编写了代码,将该页面上的所有链接解析为一个链接库。接下来,它从刚刚创建的存储库中获取任何url的内容,将这个新内容中的链接解析到存储库中,并对存储库中的所有链接继续这个过程,直到获取给定数量的链接为止。class Crawler(object):
浏览 3
修改于2013-10-06
得票数 1
回答已采纳
1
回答
柔性Web
爬虫
我被我的网络
爬虫
暂时塞住了。
浏览 1
提问于2016-05-01
得票数 0
回答已采纳
1
回答
Web
爬虫
错误
所以我做了这个网络
爬虫
只是为了练习,我很确定我的代码是好的。我有下面的代码,我可以发布它所引起的错误,但是它实际上是值得的,所有的错误都来自请求包。我能修好这个吗?我只是想学习一些Python,如果我能创建一个功能良好的web
爬虫
,我会非常高兴的。
浏览 2
修改于2015-12-24
得票数 0
3
回答
web
爬虫
性能
我有兴趣知道在一个非常一般的情况下(一个自制的业余网络
爬虫
)会有什么样的表现。更具体地说,一个
爬虫
程序可以处理多少个页面。
浏览 3
修改于2010-09-13
得票数 1
回答已采纳
2
回答
php
爬虫
检测
我想将
爬虫
重定向到我的sitemap.xml,因为这将是最新的页面,并将包含他们需要的所有信息,但我希望我的老读者在php页面上显示一个html站点地图。
浏览 0
修改于2011-09-20
得票数 2
回答已采纳
10
回答
如何编写
爬虫
?
我曾经想过尝试写一个简单的
爬虫
,它可以爬行,并为我们的NPO的网站和内容生成一个搜索结果列表。 有没有人对如何做到这一点有什么想法?你从哪里开始抓取
爬虫
?它是如何传回它的发现并继续爬行的呢?
浏览 5
修改于2014-04-14
得票数 64
2
回答
Android GUI
爬虫
有谁知道抓取android应用程序GUI的好工具吗?我找到了,但不知道如何运行它...
浏览 0
提问于2013-06-28
得票数 3
回答已采纳
1
回答
运行网站
爬虫
我正在用java编写一个网站
爬虫
,我想知道运行它最明智的方式是什么?这不是一个真正的网络
爬虫
,因为它只关心x个网站,但我想不断循环通过这些网站(24小时),以确保我有最新的内容。
浏览 0
提问于2012-01-10
得票数 0
回答已采纳
1
回答
PHP网络
爬虫
我正在寻找一个PHP的网络
爬虫
收集一个大型网站的所有链接,并告诉我,如果链接被打破。问题不是抓取链接,而是规模问题我不确定我修改的脚本是否足以抓取可能有数千个URL,因为我尝试将搜索链接的深度设置为4,但
爬虫
在浏览器中超时。
浏览 0
修改于2017-05-23
得票数 0
1
回答
识别网络
爬虫
以下属性是否足够可靠以识别搜索引擎web
爬虫
? 也许我可以使用HttpRequest UserAgent属性来识别它们。如果是这样的话,请有人建议一个当前的
爬虫
名称列表,我相信必应机器人,例如,是所谓的bingbot,如提到的。
浏览 0
修改于2012-08-03
得票数 2
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券