有一个名为"www.localbanya.com“的网站,我想从那个网站获取HTML信息,他们列出产品,他们的显示结构是:
现在,由于这是基于javascript的,我无法使用WebClient获得整个页面源。
我想知道是否有任何方法可以在使用WebClient类检索整个页面信息的同时更新页面源,或者可以使用其他任何方法一次获得整个页面的HTML信息。
您可以将此引用为本地产品页面
任何帮助都是非常感谢的。
发布于 2014-03-07 10:39:14
WebClient显然不运行javascript。
所以你需要某种无头浏览器来完成它。
虽然我不知道有任何C#或.NET实现,但它有很多选项。
您可以查看幻影JS和其他无头浏览器,它们复制了普通浏览器的功能,并且可以为其编写脚本。
也请参考这个问题C# (.NET)的无头浏览器?
您还可以运行类似费德勒的命令,查看在向下滚动时从页面中发出了哪些请求,以反向工程如何检索数据,并在可能的情况下使用WebClient进行复制。
希望这能有所帮助。
https://stackoverflow.com/questions/22247592
复制相似问题