首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >AngleSharp解析

AngleSharp解析
EN

Stack Overflow用户
提问于 2016-03-19 10:37:21
回答 1查看 15.8K关注 0票数 6

在没有类名或id可供使用的情况下,找不到许多使用AngleSharp进行解析的示例。

HTML

代码语言:javascript
复制
<span><a href="google.com" title="Google"><span class="icon icon_none"></span></a></span>
<span><a href="bing.com" title="Bing"><span class="icon icon_none"></span></a></span>
<span><a href="yahoo.com" title="Yahoo"><span class="icon icon_none"></span></a></span>

我想从任何标题为Bing的<a>标记中查找href

在Python BeautifulSoup中,我将使用

代码语言:javascript
复制
item_needed = a_row.find('a', {'title': 'Bing'})

然后获取href属性

或jQuery

代码语言:javascript
复制
a[title='Bing']

但是,我坚持使用AngleSharp例如。下面是示例https://github.com/AngleSharp/AngleSharp/wiki/Examples#getting-certain-elements

c# AngleSharp

代码语言:javascript
复制
var parser = new AngleSharp.Parser.Html.HtmlParser();
var document = parser.Parse(@"<span><a href=""google.com"" title=""Google""><span class=""icon icon_none""></span></a></span>< span >< a href = ""bing.com"" title = ""Bing"" >< span class=""icon icon_none""></span></a></span><span><a href = ""yahoo.com"" title=""Yahoo""><span class=""icon icon_none""></span></a></span>");

//Do something with LINQ
var blueListItemsLinq = document.All.Where(m => m.LocalName == "a" && //stuck);
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-19 16:07:06

看起来你的超文本标记语言中有一个问题,导致AngleSharp找不到目标元素,即尖括号周围的空格:

代码语言:javascript
复制
< span >< a href = ""bing.com"" title = ""Bing"" >< span class=""icon icon_none"">

修复HTML后,LINQ和CSS选择器都成功选择了目标链接:

代码语言:javascript
复制
var parser = new AngleSharp.Parser.Html.HtmlParser();
var document = parser.ParseDocument(@"<span><a href=""google.com"" title=""Google""><span class=""icon icon_none""></span></a></span><span><a href = ""bing.com"" title = ""Bing""><span class=""icon icon_none""></span></a></span><span><a href = ""yahoo.com"" title=""Yahoo""><span class=""icon icon_none""></span></a></span>");

//LINQ example
var blueListItemsLinq = document.All
                                .Where(m => m.LocalName == "a" && 
                                            m.GetAttribute("title") == "Bing"
                                       );

//LINQ equivalent CSS selector example
var blueListItemsCSS = document.QuerySelectorAll("a[title='Bing']");

//print href attributes value to console
foreach (var item in blueListItemsCSS)
{
    Console.WriteLine(item.GetAttribute("href"));
}
票数 11
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36097193

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档