首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >一种高效的网页信息下载方法

一种高效的网页信息下载方法
EN

Stack Overflow用户
提问于 2012-07-19 04:52:50
回答 1查看 84关注 0票数 0

在你停止阅读并建议HTML Agility (基于标题)之前,我已经在使用这个工具了。问题是这样的:我有一个网页,上面列出了一大堆案例编号,并有到单个案例编号页面的链接。我的应用程序已经下载了这些信息,并将其显示在datagridview中。然而,在我的应用程序中,我还需要来自单个案例编号页面(链接)的信息。

问题是,我已经知道,使用HTML敏捷性将永远需要花费时间。要获取案例页面,大约需要2分钟。代码方面,我为HTML agility提供了HTML代码,将单元格值添加到数组中,并解析出要在网格中显示的数组索引。这是对页面上组件数量的一个非常大的数组解析。

从链接页面中获取主页和特定单元格有什么想法吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-07-19 15:49:10

演示如何在HmtlAgility中使用XPath的示例

新建文档=

HtmlDocument();doc.LoadHtml(yourHtml);

示例1 : //下面的示例将获取所有的div,并将类作为容器foreach ( doc.DocumentNode.SelectNodes("//div@class='container'"))中的HtmlNode节点{

Console.Writeline(node.InnerText);}

示例2: div //下面的示例将获取第一个,并将类作为doc.DocumentNode.SelectNodes("//div@class='container'"))中的容器HtmlNode节点

Console.Writeline(node.InnerText);

您可以使用Xpath查询来获取所需的元素

有关XPath语法及更多信息,请使用链接http://www.w3schools.com/xpath/xpath_syntax.asp

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11550158

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档