在你停止阅读并建议HTML Agility (基于标题)之前,我已经在使用这个工具了。问题是这样的:我有一个网页,上面列出了一大堆案例编号,并有到单个案例编号页面的链接。我的应用程序已经下载了这些信息,并将其显示在datagridview中。然而,在我的应用程序中,我还需要来自单个案例编号页面(链接)的信息。
问题是,我已经知道,使用HTML敏捷性将永远需要花费时间。要获取案例页面,大约需要2分钟。代码方面,我为HTML agility提供了HTML代码,将单元格值添加到数组中,并解析出要在网格中显示的数组索引。这是对页面上组件数量的一个非常大的数组解析。
从链接页面中获取主页和特定单元格有什么想法吗?
发布于 2012-07-19 15:49:10
演示如何在HmtlAgility中使用XPath的示例
新建文档=
HtmlDocument();doc.LoadHtml(yourHtml);
示例1 : //下面的示例将获取所有的div,并将类作为容器foreach ( doc.DocumentNode.SelectNodes("//div@class='container'"))中的HtmlNode节点{
Console.Writeline(node.InnerText);}
示例2: div //下面的示例将获取第一个,并将类作为doc.DocumentNode.SelectNodes("//div@class='container'"))中的容器HtmlNode节点
Console.Writeline(node.InnerText);
您可以使用Xpath查询来获取所需的元素
有关XPath语法及更多信息,请使用链接http://www.w3schools.com/xpath/xpath_syntax.asp
https://stackoverflow.com/questions/11550158
复制相似问题