腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
JS中的
爬虫
框架
我正在寻找一个网络
框架
/蜘蛛,可以爬行一个不规则的网站(一个网站没有一个容易定义的页面结构,例如使用url中的标题字符串索引),并搜索关键字。可以很容易地定制,并且可以很容易地在JS (最好是)或C#中编写附加功能的东西 我是网络
爬虫
行业的新手,所以只要给我一个
框架
,我会很高兴自己去读它。谢谢:)
浏览 0
提问于2015-02-16
得票数 0
3
回答
有没有java script web
爬虫
框架
?
有没有JavaScript网络
爬虫
框架
?
浏览 0
修改于2011-04-06
得票数 13
1
回答
有没有Objective-C网络
爬虫
框架
?
有没有Objective-C网络
爬虫
框架
?
浏览 0
提问于2011-04-09
得票数 2
回答已采纳
1
回答
爬虫
框架
scrapy测试运行时出错,求解决?
爬虫
、
scrapy
、
框架
、
连接
、
终端
安装成功scrapy
框架
后,在pycharm终端里面输入 scrapy bench 命令后,出现由于目标计算机积极拒绝,无法连接。的问题,这个怎么解决,
浏览 161
提问于2024-02-21
1
回答
用于web
爬虫
的Rx
框架
我发现Rx
框架
看起来对异步操作真的很有用,但我不能理解如何使用它来下载很多页面。
浏览 0
提问于2012-05-22
得票数 0
回答已采纳
1
回答
既然有C语言的
框架
,那为什么还要为Objective-C编写一个网络
爬虫
框架
呢?
我想为Objective-C写一个网络爬行库!但是有一个可用于C语言的库!有什么表现吗?或者任何原因?
浏览 2
提问于2011-04-13
得票数 1
回答已采纳
2
回答
在网站和独立应用程序中使用Django
框架
我计划为它写一个网络
爬虫
和一个基于网络的前端(或者至少是它找到的信息)。我想知道是否可以使用Django
框架
让网络
爬虫
使用与网站相同的MySQL后端(而不是让网络
爬虫
本身成为“网站”)。
浏览 1
修改于2013-03-14
得票数 1
回答已采纳
1
回答
Scrapy:如何从crawler获取处理过的流水线项目?
爬虫
是一个更大的
框架
的一部分,它需要
爬虫
返回一个解析的项目列表。 在Scrapy中,我实现了一个包含几个规范化步骤的管道。由于Scrapy是更大的
框架
的一部分-如果我可以在通过整个管道后将项目返回到
爬虫
和/或
框架
,那就太好了。有没有办法做到这一点?
浏览 0
修改于2013-12-05
得票数 0
1
回答
如何提取我的
爬虫
目前所站的网址?
我正在使用python中的scrapy
框架
制作一个web
爬虫
。其主要思想是,
爬虫
从页面中提取一些数据,如果数据符合某些条件,
爬虫
应该提取其当前所处的URL。是否有一些方法/函数可以获得当前的URL?
浏览 5
提问于2016-11-27
得票数 0
回答已采纳
1
回答
如何防止刮伤从伐木?
我正在从一个更大的
框架
中调用一个基于Scrapy的
爬虫
。在爬行过程中,Scrapy记录所有事件。抓取之后,抓取应该停止日志记录,调用
框架
应该接管日志记录任务,并再次打印出来。如何阻止Scrapy 控制所有日志并将其传递回我的
框架
?更新:我将crawler.spider.settings.overrides['LOG_ENABLED'] = False添加到我的
爬虫
中。刮痕一直在阻止我打印到标准版。
浏览 2
修改于2013-12-10
得票数 1
5
回答
C#中任何好的开源网络爬行
框架
我已经决定在C#中构建
爬虫
。我对HttpWebRequest/HttpWebResponse类有很多不好的体验,众所周知,它们对于大型
爬虫
来说是高度错误和不稳定的。即使在
框架
4.0中,它们也是有缺陷的。 我是根据自己的亲身经历说的。如果他们知道有什么好的开源
爬虫
框架
,比如java有nutch和apache commons,它们是非常稳定和高度健壮的库,我想要这里的专家们的意见,他们已经编码
爬虫
程序。如果C#中已经存在一些爬行
框架
,我将继续在它们之上构建我的应用
浏览 2
修改于2010-12-06
得票数 9
回答已采纳
1
回答
可能的反爬行者
我想我会写一个
爬虫
,从www.wordreference.com获取单词。我在机械化
爬虫
框架
中使用Python。这个网站有没有可能有防
爬虫
机制?
浏览 5
修改于2011-04-08
得票数 1
回答已采纳
2
回答
插入到Rails数据库中
我是Ruby on Rails的新手,我想创建一个抓取数据并将其插入数据库的
爬虫
。我目前使用的是Heroku,所以我不能直接访问数据库,我想知道将
爬虫
脚本集成到RoR
框架
中的最好方法是什么。
浏览 2
提问于2011-03-17
得票数 0
2
回答
最适合用于图像爬行的开源、可扩展
爬虫
我们正处于一个项目的开始阶段,我们目前想知道哪个
爬虫
是我们最好的选择。基本上,我们要建立Hadoop和抓取网络上的图像。一些特殊问题:现在这些看起来是最好的三种选择-摘要: 我们需要从网络上获取尽可能多的图片。现有的爬行
框
浏览 5
修改于2009-07-28
得票数 3
1
回答
使用实体
框架
C#限制到数据库的连接
我的问题是,我有几个
爬虫
填充这个数据库,以供我们的网站使用实体
框架
。还有其他方法来实现这一点吗?
浏览 2
修改于2016-08-03
得票数 5
回答已采纳
2
回答
使用Java的web索引器
当用Java开发时,并行系统和分布式系统哪个更适合网站
爬虫
和web索引器?可用的
框架
有哪些?
浏览 3
修改于2012-03-01
得票数 2
回答已采纳
1
回答
将模型绑定到最初由服务器填充的HTML表
但是,我需要服务器来生成初始页面,而JavaScript MVC/MVVM
框架
将从呈现的表+任何所需的注释中生成它的初始模型。我尝试过许多JavaScript MVC/MVVM
框架
,例如AngularJS和Knockout.js,但是它们似乎假设了一种方法,即服务器将提供一个HTML模板,而该
框架
将通过JavaScript在客户端填充表编辑: “普通”用户和
爬虫
的页面内容和URL应该相同。
浏览 1
修改于2013-08-29
得票数 0
回答已采纳
2
回答
基于源代码片段的javascript或/和css搜索引擎
有没有人知道有一个服务/
爬虫
/
爬虫
可以获取通过标准方法(或延迟加载,任何它可以处理的)嵌入的javascript或CSS资源。或者,在这个问题上,在
框架
之外搜索一些独特的东西,并了解其受欢迎程度。
浏览 1
提问于2009-11-26
得票数 3
回答已采纳
3
回答
单页应用程序Web
爬虫
和SEO
我在前端使用
框架
将我的博客创建为单页面应用程序。为了进行查询,我在后端使用了rest API和Django。由于所有内容都是使用javascript代码呈现的,当
爬虫
访问我的博客时,它们看到的只是一个空页面。我正在考虑查看用户代理,每当用户代理来自
爬虫
时,我都会将页面的渲染版本提供给它,但我在实现上述方法时遇到了问题。为网络
爬虫
创建一个在后台SEO友好的rest API和Django的单页应用程序的最佳实践是什么?
浏览 0
提问于2017-08-16
得票数 1
1
回答
检查500错误以旁路
我使用Scrapy
框架
来抓取数据。如果我的
爬虫
遇到500错误,它将被中断。因此,我需要在解析web内容之前检查可用的链接。非常感谢。
浏览 3
修改于2012-08-31
得票数 0
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券