首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >帮我搞定雷吉斯。需要提取`<A HREF` `

帮我搞定雷吉斯。需要提取`<A HREF` `
EN

Stack Overflow用户
提问于 2011-04-20 07:48:10
回答 5查看 742关注 0票数 1

我有<A HREF="f110111.ZIP">f110111 -是一个任意的字符序列。我需要C# regex匹配表达式来提取上述所有内容。

例如,投入是

<A HREF="f110111.ZIP"><A HREF="qqq.ZIP"><A HREF="gygu.ZIP">

我要名单:

  • f110111.ZIP
  • qqq.ZIP
  • gygu.ZIP
EN

回答 5

Stack Overflow用户

发布于 2011-04-20 07:52:06

你需要的是赫姆拉格包装/!这将允许您以简单的方式读取HTML,并提供一种检索链接的简单方法。

票数 3
EN

Stack Overflow用户

发布于 2011-04-20 07:55:21

如果文件名中可以有多个点:

代码语言:javascript
复制
<A HREF="(^["]+?).zip

如果文件名中没有点(就在zip之前),您可以使用一个更快的点:

代码语言:javascript
复制
<A HREF="(^[".]+)

C#示例:

代码语言:javascript
复制
Pattern pattern = Pattern.compile("<A HREF=\"(^[\"]+?).zip");

Matcher matcher = pattern.matcher(buffer);
while (matcher.find()) {
    // do something with: matcher.group(1)
}
票数 2
EN

Stack Overflow用户

发布于 2011-04-20 07:50:09

不,不!不要使用Regex解析HTML!

尝试XML解析器。或者是XPath

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5727136

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档