首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >抓取数据,加载脚本

抓取数据,加载脚本
EN

Stack Overflow用户
提问于 2015-07-13 11:56:17
回答 2查看 563关注 0票数 0

最近,我试图使用C#从网页中删除一些数据。我的问题是,在C#中,当我使用WebBrowser对象对网页进行操作时,当我导航到正文中的网页时,我只能得到:

代码语言:javascript
复制
<body>
    <script language="javascript"   src="com.astron.kapar.WebClient/com.astron.kapar.WebClient.nocache.js"></script>
</body>

但是,如果您访问实际的网页GB并查看源代码,可能是因为浏览器加载了脚本,所以正文中有一些表。

我的问题是,在C#中,如何操作或处理这种网页?例如,选择一些日期并获取一些数据?有好的图书馆吗?

抱歉英语不太好。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-07-13 12:32:32

您需要使用无头IE或无头WebKit。

这些问题也可能是相关的。

C# (.NET)的无头浏览器?

支持爬虫javascript的c#无头浏览器

票数 0
EN

Stack Overflow用户

发布于 2017-06-13 08:32:14

如果您熟悉javascript,那么废除javascript驱动的站点的一个很好的解决方案就是卡珀尔

我发现casperjs真的很容易使用,以消除javascript-沉重的网站。

  1. 编写一个casperjs script,用css selectors报废站点,并使用JSON.Stringify将所需的输出以JSON的形式发送到stdout
  2. 使用casperjsC#调用ProcessStartInfo。从stdout读取,并将json序列化回POCO
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31382723

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档