首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何解析网页中的动态内容?

如何解析网页中的动态内容?
EN

Stack Overflow用户
提问于 2012-08-24 01:48:52
回答 1查看 3K关注 0票数 5

我尝试从这个url获取代理列表:

Free proxy list

这可能很酷,但是端口号是动态JavaScript内容。如何从该页面获取JavaScript生成的内容?我有jsoup和djNativeSwing,但我想在后台线程中做这件事。

代码语言:javascript
复制
JWebBrowser webBrowser = new JWebBrowser();
webBrowser.navigate("http://spys.ru/en/free-proxy-list/");
System.out.println(webBrowser.getHTMLContent());

此代码返回Null结果。请帮帮忙。

EN

回答 1

Stack Overflow用户

发布于 2012-08-24 02:02:14

调用getHtmlContent()方法时,when浏览器尚未完成加载。改用下面这样的代码:

代码语言:javascript
复制
JWebBrowser webBrowser = new JWebBrowser();
webBrowser.navigate("http://spys.ru/en/free-proxy-list/");
webBrowser.addWebBrowserListener(new WebBrowserListener(){
   public void loadingProgressChanged(WebBrowserEvent e){
       if(e.getWebBrowser().getLoadingProgress()==100)
            System.out.println(webBrowser.getHTMLContent());
   }
}
/* Note: I wrote this in the comment field without any testing,
   you probably have to make the webBrowser final. */

JavaDocs是你的朋友!

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12097352

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档