我正在从一个坏掉的RSS提要中获取数据,这个RSS提要给了我错误的链接。我想修复这个链接,所以我编写了以下代码:
<link.*>(.*)&.*tid(.*)</link>链接可能是这样的:
www.somedomain.com/?value=50&burrrdurrrr;tid=120但真正起作用的链接是这样的:
www.somedomain.com/?value=50&tid=120我想问的是如果我的测量结果是这样的:
[FeedURL]
Measure=Plugin
Plugin=Plugins\WebParser.dll
Url=[Feed]
StringIndex=2 ;now I only get www.somedomain.com/?value=50
Substitute=#SubstituteFeed#我应该如何将字符串连接在一起来完成url?
发布于 2014-05-24 03:05:11
我猜这个链接不是&burrrdurrrr;,而是&,这就是在超文本标记语言或可扩展标记语言中编写&的方式。
如果是这样的话,您只需按照此handy-looking tutorial中的描述执行set the DecodeCharacterReference option即可。这里提到的另一个选择是Substitute,即使它真的是&burrrdurrrr;,它也能够将其剥离出来。
所有这些都不是处理超文本标记语言或可扩展标记语言的一种特别明智的方法-一个更好的方法是一个插件,它实际解析文档结构,并允许您使用XPath或CSS规则引用节点-但我想您可以使用已有的内容。(我以前从来没有听说过这个“雨量计”,尽管它号称是“最著名和最受欢迎的Windows桌面定制程序”;也许是因为没有人这样叫他们的程序,而是几乎普遍使用“窗口小部件”这个词?)
https://stackoverflow.com/questions/23836459
复制相似问题