首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >C#爬虫程序无法加载动态内容

C#爬虫程序无法加载动态内容
EN

Stack Overflow用户
提问于 2019-07-09 22:49:52
回答 1查看 183关注 0票数 0

我正在使用Abot库来抓取网页。爬虫可以正确地请求页面,但问题是几乎所有内容都是通过knockout.js动态加载的。爬虫程序目前无法请求此内容,这导致只加载了页面的一小部分。

我试着让程序等待,希望动态的请求无论如何都会被发送,但这似乎不起作用。

我希望加载整个页面,但只加载页面的底部。

如何才能使crawler请求所有数据?

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2019-07-09 23:07:37

简短的回答:

这种方式是不可能的,你需要像浏览器一样为你处理JS。我推荐来自Scrapy的Splash (它可以通过REST API与任何语言集成)。

但在我看来,如果你不需要企业解决方案,就不要使用C#进行网络爬行,例如,python中有最简单的解决方案和更完整的库。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56955251

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档