首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何抓取动态网页

如何抓取动态网页
EN

Software Recommendation用户
提问于 2019-01-10 15:33:11
回答 1查看 49关注 0票数 1

我想刮网页与动态加载的内容。作为一个浏览这个网页的用户,在动态地将感兴趣的内容加载到页面之前,我必须单击HTML元素。

我知道如何以编程方式从服务器检索初始HTML,但如何以编程方式发出类似浏览器的单击,并执行任何适当的javascript,以便访问动态内容?

我是否需要在我的抓取应用程序中托管一个浏览器控件?

任何语言都适用于我,但C++/C#优先。

谢谢。

EN

回答 1

Software Recommendation用户

回答已采纳

发布于 2019-01-10 16:12:46

我使用控制一个无头Chrome浏览器。这提供了对完整浏览器功能的访问,例如javascript和动态内容。您可以像使用鼠标一样以完全相同的方式以编程方式控制浏览器,但在代码中使用XPath元素除外。

在开发阶段,我运行一个完整的浏览器,这样我就可以看到它的交互,如果有一个未发现的错误,我也可以很容易地使用开发工具进行故障排除。

我用Python。这个页面似乎表明支持C#。

票数 1
EN
页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwarerecs.stackexchange.com/questions/54596

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档