文章/答案/技术大牛

发布

社区首页 >问答首页 >如何解析网页中的动态内容？

问如何解析网页中的动态内容？
EN

Stack Overflow用户

提问于 2012-08-24 01:48:52

回答 1查看 3K关注 0票数 5

我尝试从这个url获取代理列表：

Free proxy list

这可能很酷，但是端口号是动态JavaScript内容。如何从该页面获取JavaScript生成的内容？我有jsoup和djNativeSwing，但我想在后台线程中做这件事。

JWebBrowser webBrowser = new JWebBrowser();
webBrowser.navigate("http://spys.ru/en/free-proxy-list/");
System.out.println(webBrowser.getHTMLContent());

此代码返回Null结果。请帮帮忙。

jsoup

dynamic-data

java

javascript

html-parsing

回答 1

Stack Overflow用户

发布于 2012-08-24 02:02:14

调用getHtmlContent()方法时，when浏览器尚未完成加载。改用下面这样的代码：

JWebBrowser webBrowser = new JWebBrowser();
webBrowser.navigate("http://spys.ru/en/free-proxy-list/");
webBrowser.addWebBrowserListener(new WebBrowserListener(){
   public void loadingProgressChanged(WebBrowserEvent e){
       if(e.getWebBrowser().getLoadingProgress()==100)
            System.out.println(webBrowser.getHTMLContent());
   }
}
/* Note: I wrote this in the comment field without any testing,
   you probably have to make the webBrowser final. */

JavaDocs是你的朋友！

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/12097352

复制

相似问题

问如何解析网页中的动态内容？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何解析网页中的动态内容？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何解析网页中的动态内容？
EN