我正在用Perl/LWP构建一个网络爬虫。webcrawler如何跟踪ASP.NET网格中的链接:
<a id="ctl00_MainContent_listResult_Top_LnkNextPage" href="javascript:__doPostBack('ctl00$MainContent$listResult$Top$LnkNextPage','')">Next</a>发布于 2009-06-14 23:08:40
看起来有一个名为WWW::Scripter的带有javascript和ajax插件的WWW::Mechanize子类应该能够做到这一点。我还没有尝试过这种特殊的方法。
另一种选择是WWW::Selenium,它工作得很好,但对您来说可能会有太多开销/设置。
发布于 2009-06-15 07:32:49
参见CPAN module HTML::TreeBuilderX::ASP_NET。
发布于 2013-01-15 17:40:10
使用WWW-Mechanize Firefox,它能够检索/跟踪任何Firefox可能的链接。
您需要在firefox上安装mozrepl插件,perl模块将连接到该插件并使用firefox打开链接。
http://metacpan.org/pod/WWW::Mechanize::Firefox
示例:http://metacpan.org/pod/WWW::Mechanize::Firefox::Examples
https://stackoverflow.com/questions/993915
复制相似问题