文章/答案/技术大牛

发布

社区首页 >问答首页 >java网页阅读器

问java网页阅读器
EN

Stack Overflow用户

提问于 2010-12-14 16:46:09

回答 2查看 370关注 0票数 0

我想检索网页中的所有链接，但网页使用的是javascript，并且每个页面都包含许多链接。

如何转到下一页并读取其在java程序中的内容？

java

javascript

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-12-14 17:08:34

从Javascript页面获取这些信息可能是一项艰巨的工作。您的程序必须解释整个页面，并理解JS正在做什么。并不是所有的网络蜘蛛都这么做。

大多数现代的JS库(jquery等)大多是操纵CSS和HTML元素的属性。因此，首先必须从HTML源代码和JS生成“平面”HTML，然后可能在平面HTML代码上运行一个经典的网络爬行器。

(例如，FF webdeveloper插件允许在所有JS完成后查看页面的原始源代码和生成的代码)。

票数 1

Stack Overflow用户

发布于 2010-12-14 16:50:41

您要查找的内容名为Web Spider engine。有很多开源的网络蜘蛛引擎是可用的。检查http://j-spider.sourceforge.net/，例如

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/4437324

复制

相似问题

问java网页阅读器
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问java网页阅读器EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问java网页阅读器
EN