腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
如果我为我的python脚本做了一个简单的gui,它会影响它的效率吗?
嗨,我想做一个网页
爬虫
,检查URL的数据,如果我做一个简单的Gui,使脚本更容易查找变量的数据,添加代码的gui会使我的网络
爬虫
效率降低吗? 我需要
爬虫
尽可能
高效
,能够尽可能快地处理数据。为这个Python脚本制作一个gui,会不会妨碍web
爬虫
的性能?
浏览 3
修改于2015-01-27
得票数 0
回答已采纳
5
回答
Googlebot是用哪种编程语言编写的(或任何其他
高效
的网络
爬虫
)?
或者,更普遍的是,
高效
的网络
爬虫
是用哪种语言编写的? 我见过很多Java语言,但在我看来,它不是最适合开发网络
爬虫
的语言,因为它产生了太多的开销(尝试使用Heritrix网络
爬虫
,它非常重)。
浏览 0
提问于2009-10-29
得票数 1
回答已采纳
1
回答
如何在Scrapy中运行多个相同的
爬虫
?
这些urls在一个域名中,我用Scrapy编写了一个
爬虫
程序,我需要使用相同的
爬虫
程序一起运行这些urls。如果我有10个urls,我想创建10个相同的进程来运行
爬虫
程序,以提
高效
率。有解决方案吗?我尝试使用CrawlerProcess来运行
爬虫
,但是如果urls太多,它会提醒我有太多TCP连接的错误。虽然crawler始终处于运行状态,但这种方法不利于维护。CrawlerProcess(get_project_settings()) page_urls = ['http://
浏览 0
提问于2019-01-06
得票数 0
1
回答
Python中的多线程
爬虫
它真的很
高效
吗?我计划用Python创建一个
爬虫
,为了使程序
高效
,我想创建尽可能多的线程,每个线程将下载一个网站。我试着在网上查找一些信息;不幸的是,我找不到太多。
浏览 16
提问于2019-10-27
得票数 0
回答已采纳
1
回答
最有效的语言来创建一个非常快的网络
爬虫
?
我应该使用哪种语言来创建一个
高效
的网络
爬虫
?
浏览 1
提问于2014-02-19
得票数 0
1
回答
perl
中的Web Crawler问题
我用
Perl
构建了一个网络
爬虫
。HTML::ContentExtractor 从网页中提取文本。它非常适合其他网页,我不知道为什么这个
爬虫
在aspx页面上会失败。
浏览 8
修改于2017-05-23
得票数 0
3
回答
Perl
或Python SVN Crawler
有没有一个SVN
爬虫
,可以遍历SVN存储库,并吐出所有现有的分支或标记? 最好是用
Perl
或Python ...
浏览 1
提问于2011-08-02
得票数 0
4
回答
对mongodb地理空间查询的结果进行有效排序
我有一个非常大的文档集合,比如:并希望能够
高效
地执行如下查询:.sort({ relevance: -1 }) 这导致所有东西都被磨得像
爬虫
一样(在任何特定的框中都可能有大量的结果,我只需要前10个左右)。
浏览 0
修改于2013-09-03
得票数 4
1
回答
带有简单动态内容"listener“的
Perl
webcrawler
我正在尝试用
Perl
做一个简单的网络
爬虫
,但是很多网站都有动态内容加载,例如,使用javascript函数: $("#blabla").load('blublu/bla.php');因此,我正在尝试调整我已经拥有的网络
爬虫
(获取HTML内容),以“等待”这些脚本加载,然后才获取整个(和完整)网站内容(HTML)。问题是,我对
Perl
编程和模块实现不是很在行,所以我想知道是否有好心的人愿意在这里
浏览 2
修改于2013-01-15
得票数 2
回答已采纳
3
回答
递归web
爬虫
perl
我正在尝试写一个最小的网络
爬虫
。其目的是从种子中发现新的URL,并进一步爬行这些新的URL。
浏览 1
修改于2014-04-15
得票数 3
3
回答
高效
网络
爬虫
的语言建议
我正在寻找一种语言来编写一个
高效
的网络
爬虫
。
浏览 6
提问于2010-12-03
得票数 2
1
回答
比regex更好的系统
对于这个简单的
爬虫
,还有比正则表达式更
高效
的进程或想法吗?
浏览 0
修改于2012-05-21
得票数 3
1
回答
如何提高/最大化当前数据库/表结构的效率?
skill_
2
_details skill_3 skill_3_details
2
Excel I use Excel daily SAP SAP ReportingDetails: John writes
Perl
问题: 1)考虑到显示要求,应对表结构进行哪些重新调整/更改以提
高效</e
浏览 10
提问于2019-12-16
得票数 1
3
回答
Perl
web
爬虫
如何跟踪ASP.NET回发?
我正在用
Perl
/LWP构建一个网络
爬虫
。
浏览 0
修改于2010-08-19
得票数 5
1
回答
Perl
LWP内存泄漏?
我有一个连续运行的
爬虫
(使用
Perl
),我使用HTML::TreeBuilder对爬行的网页进行提取。我孜孜不倦地删除了我创建的HTML::TreeBuilder的每个实例,但是
爬虫
的内存占用却缓慢而稳定地上升(我正在看着它以10到30个字节的速度与每一个爬行的页面一起运行(我正在使用Valgrind来测量堆的使用情况我正在运行
Perl
版本5.10.1 谢谢!
浏览 0
提问于2012-02-15
得票数 0
回答已采纳
2
回答
如何用
Perl
运行网页的Javascript?
可能重复: 我对学习
Perl
很感兴趣,并且刚刚开始用
Perl
编写一个web
爬虫
。在我爬行的页面上,有一个给页面投票的Javascript。它显示当前页面的投票,只有当我单击投票星号时。
浏览 0
修改于2017-05-23
得票数 0
回答已采纳
4
回答
"in“的有效替代
我正在编写一个网络
爬虫
,最终目标是创建
爬虫
所走路径的地图。虽然我不知道其他
爬虫
以多快的速度抓取页面,但我的
爬虫
每分钟大约有2000页。for href in tempUrl:所以我的问题是,在提
高效
率的同时实现相同功能的另一种
浏览 0
修改于2011-06-29
得票数 4
回答已采纳
1
回答
Python
爬虫
。解析和执行ajax
我有一个
爬虫
的基本结构。现在我在一些php驱动的网站上发布了它,它就像一个护身符。不过,现在我想让它从ajax内容构建数据表。目前,我正在使用Mechanize for PYTHON和
perl
来构建我的
爬虫
。虽然机械化模块不执行AJAX。如何访问由异步ajax构建的内容?
浏览 2
提问于2012-01-26
得票数 2
回答已采纳
3
回答
Perl
并行
爬虫
多线程
我有一个多线程的
Perl
爬虫
,它可以很好地工作,如果我在array.How中声明URL,即使我从数据库中读取URL,我得到了“分段失败”error.Please帮助我修复这个issue.Thanksmy @URLs =qw(http://www.example.comhttp://www.example.com
2
浏览 0
修改于2015-01-22
得票数 0
1
回答
如何使用
perl
存储和显示ISO-8859-1和UTF8字符
我正在使用
perl
编写一个web
爬虫
,web
爬虫
将使用LWP和一些简单的正则表达式提取某些信息。 这些信息保存在mySQL数据库中,该数据库将在安卓设备上使用。然而,当我测试网页
爬虫
时,我意识到有些信息是用HTML数字编码(&# 20856;&# 33775 ;)用中文(典華),而有些信息是使用iso-8859-1编码(Zhífú)。我使用
PERL
::Entities库解决了中文部分,当我将控制台设置为utf8时可以显示该库。然而,其他字母(Zhífú)只能显示在iso-8859-1中。
浏览 4
提问于2011-09-09
得票数 3
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券