文章/答案/技术大牛

发布

社区首页 >问答首页 >C#爬虫程序无法加载动态内容

问C#爬虫程序无法加载动态内容
EN

Stack Overflow用户

提问于 2019-07-09 22:49:52

回答 1查看 183关注 0票数 0

我正在使用Abot库来抓取网页。爬虫可以正确地请求页面，但问题是几乎所有内容都是通过knockout.js动态加载的。爬虫程序目前无法请求此内容，这导致只加载了页面的一小部分。

我试着让程序等待，希望动态的请求无论如何都会被发送，但这似乎不起作用。

我希望加载整个页面，但只加载页面的底部。

如何才能使crawler请求所有数据？

谢谢!

request

web-crawler

abot

回答 1

Stack Overflow用户

发布于 2019-07-09 23:07:37

简短的回答：

这种方式是不可能的，你需要像浏览器一样为你处理JS。我推荐来自Scrapy的Splash (它可以通过REST API与任何语言集成)。

但在我看来，如果你不需要企业解决方案，就不要使用C#进行网络爬行，例如，python中有最简单的解决方案和更完整的库。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56955251

复制

相似问题

问C#爬虫程序无法加载动态内容
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问C#爬虫程序无法加载动态内容EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问C#爬虫程序无法加载动态内容
EN