首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何抓取不在html源中但在浏览器中可见的数据?

如何抓取不在html源中但在浏览器中可见的数据?
EN

Stack Overflow用户
提问于 2012-12-02 12:49:28
回答 1查看 103关注 0票数 0

我想要的数据在浏览器中是可见的,但我无法从html源代码中找到它。我怀疑数据是由脚本生成的。我想对这样的数据进行评分。可以使用Jsoup吗?我知道Jsoup不会执行Javascript。

以学院为例,我想要抓取学院和学校下的所有学院和学校。我想要获取所有学院和学校下的学院和学校。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-12-02 12:53:50

如果dom内容是通过脚本或插件生成的,那么您真的应该考虑使用像phantomjs这样的可脚本化浏览器。然后,您可以只编写一些javascript来提取数据。

我没有检查你的链接,我假设你正在寻找一个不特定于任何页面的通用答案。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13666498

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档