文章/答案/技术大牛

发布

社区首页 >问答首页 >如何从网页中提取源码html？

问如何从网页中提取源码html？
EN

Stack Overflow用户

提问于 2012-06-02 05:49:00

回答 2查看 2K关注 0票数 1

我正在尝试提取此页面的html源代码http://www.fxstreet.com/rates-charts/currency-rates/

我想要我从chrome中将页面另存为.html文件时看到的内容。

我试着在java中做到这一点，先使用bufferedreader，然后再使用jsoup。我也尝试过用python来做这件事，但是我一直收到下面的消息：

“此网站要求启用JavaScript和Cookie。请更改浏览器设置或升级浏览器。”

最终目标是提取主表中的值。

html-parsing

jsoup

java

python

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-06-02 05:51:22

尝试使用HtmlUnit并设置setJavascriptEnabled(true)

另请参阅：this和this

JSoup不是执行Javascript的无头浏览器，所以您必须选择其他库来获取页面，然后才能使用JSoup解析它。

票数 4

Stack Overflow用户

发布于 2012-12-09 23:56:57

只需提取主表就可以使用Jsoup轻松完成

下面是一个方法，它将获取页面上主表中的所有内容

public void parse(){
        try{

        Document doc = Jsoup.connect("http://www.fxstreet.com/rates-charts/currency-rates/").get();
        Element content = doc.getElementById("ddlPairsChoose");
        Elements table = doc.getElementsByClass("applet-content");      

        System.out.print(table);

        }

        catch(Exception e){

            System.out.print("error --> " + e);
        }       
    }

它打印出页面上的表格

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/10857780

复制

相似问题

问如何从网页中提取源码html？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从网页中提取源码html？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从网页中提取源码html？
EN