首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Html敏捷包解析特殊字符时的奇怪输出

使用Html敏捷包解析特殊字符时的奇怪输出
EN

Stack Overflow用户
提问于 2021-01-23 07:03:58
回答 1查看 366关注 0票数 2

我试图刮一个法语网站,但法语语言有一些特殊的字符,如éà等,最后我得到了一些奇怪的输出,而不是那个( Google中的检查)

代码语言:javascript
复制
<a href="www.exemple.com/1" title="Soins Anti-âge et Anti-rides">
  <span>Soins Anti-âge et Anti-rides</span>
</a>

<a href="www.exemple.com/2" title="Rides installées">
  <span>Rides installées</span>
</a>

我将得到这个输出( Visualizer中的文本可视化器)

代码语言:javascript
复制
<a href="www.exemple.com/1" title="Soins Anti-&acirc;ge et Anti-rides">
  <span>Soins Anti-&acirc;ge et Anti-rides</span>
</a>

<a href="www.exemple.com/2" title="Rides install&eacute;es">
  <span>Rides install&eacute;es</span>
</a>

我的代码如下

代码语言:javascript
复制
string url = "https://universparadiscount.ma/7-product.html";
HttpClient httpClient = new HttpClient();
string html = await httpClient.GetStringAsync(url);
HtmlDocument htmlDocument = new HtmlDocument();
htmlDocument.LoadHtml(html);

string SubCategory = htmlDocument.DocumentNode.Descendants("span")
    .Where(node => node.GetAttributeValue("itemprop", string.Empty)
    .Equals("title")).LastOrDefault()?.InnerText.Trim('\r', '\n', '\t', ' ');
Console.WriteLine(SubCategory);
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-01-23 07:22:39

如果我理解这个问题,您可以使用HttpUtility.HtmlDecode

将被HTML编码的用于HTTP传输的字符串转换为已解码的字符串。

若要在web应用程序之外对值进行编码或解码,请使用WebUtility类。

示例

代码语言:javascript
复制
Console.WriteLine(SubCategory);
Console.WriteLine(HttpUtility.HtmlDecode(SubCategory));

输出

代码语言:javascript
复制
Rides install&eacute;es
Rides installées
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65856640

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档