我对学习Perl很感兴趣,并且刚刚开始用Perl编写一个web爬虫。在我爬行的页面上,有一个给页面投票的Javascript。它显示当前页面的投票,只有当我单击投票星号时。因此,在爬行过程中,我需要运行Javascript并了解页面当前的投票情况。
你有什么建议或例子吗?
谢谢..
发布于 2012-04-11 16:24:33
您需要将模块WWW::断续器与WWW::Scripter::Plugin::JavaScript结合使用。
简介:
#!/usr/bin/perl
use strict;
use warnings;
use WWW::Scripter;
$w = new WWW::Scripter;
$w->use_plugin('JavaScript'); # packaged separately
$w->get('http://some.site.com/that/relies/on/javascript');
$w->eval(' alert("Hello from JavaScript") ');
$w->document->getElementsByTagName('div')->[0]->....
$w->content; # returns the HTML content, possibly modified by scripts发布于 2012-04-11 08:28:48
使用perl驱动实际的浏览器是一种选择(例如WWW::机械化::Firefox、WWW:硒等)。要在perl中实际运行javascript,请尝试使用WWW::断续器和WWW::Scripter::Plugin::JavaScript。
https://stackoverflow.com/questions/10102125
复制相似问题