最近,我试图使用C#从网页中删除一些数据。我的问题是,在C#中,当我使用WebBrowser对象对网页进行操作时,当我导航到正文中的网页时,我只能得到:
<body>
<script language="javascript" src="com.astron.kapar.WebClient/com.astron.kapar.WebClient.nocache.js"></script>
</body>但是,如果您访问实际的网页GB并查看源代码,可能是因为浏览器加载了脚本,所以正文中有一些表。
我的问题是,在C#中,如何操作或处理这种网页?例如,选择一些日期并获取一些数据?有好的图书馆吗?
抱歉英语不太好。
发布于 2015-07-13 12:32:32
发布于 2017-06-13 08:32:14
如果您熟悉javascript,那么废除javascript驱动的站点的一个很好的解决方案就是卡珀尔。
我发现casperjs真的很容易使用,以消除javascript-沉重的网站。
casperjs script,用css selectors报废站点,并使用JSON.Stringify将所需的输出以JSON的形式发送到stdout。casperjs从C#调用ProcessStartInfo。从stdout读取,并将json序列化回POCO。https://stackoverflow.com/questions/31382723
复制相似问题