我使用Argotic Syndication Framework将rss-feed解析为提要条目。然而,我需要剥离所有html的描述。
下面显示了一个rss提要描述的示例。
Jeg blev i maj inviteret til at holde et oplæg som keynote speaker på en konference i Alaska i HETL-regi (The International Higher Education Teaching and Learning Association). Patrick Blessinger, stifteren af HETL, har netop medvirket i et amerikansk online radio … <a href="http://aesbrock.wordpress.com/2013/07/12/niels-brock-naevnt-i-amerikansk-radio-interview/">Læs resten <span class="meta-nav">→</span></a><img alt="" border="0" src="http://stats.wordpress.com/b.gif?host=aesbrock.wordpress.com&blog=978571&post=4538&subd=aesbrock&ref=&feed=1" width="1" height="1" />我希望它只显示为文本,而不是html。
我尝试使用以下正则表达式
Regex.Replace(item.Description, @"<(.|\n)*?>", string.Empty);但这并不完全正确;
我看到了关于使用HTMLAgilityPack的建议,但我希望避免使用外部库。
我们非常感谢您的任何建议。
发布于 2013-07-17 15:19:58
谢谢你的建议,Pete,但它仍然留下了一些html。我最终是这样做的。
HttpUtility.HtmlDecode(Regex.Replace(item.Description, @"<!--[\S\s]*?-->|<(?:"".*?""|'.*?'|[\S\s])*?>", ""));它来自一个帖子(在网络上的某个地方),但我没有把它放入书签,所以如果有人认出它--谢谢:)我希望它能帮助其他人。
https://stackoverflow.com/questions/17656297
复制相似问题