我有<A HREF="f110111.ZIP">和f110111 -是一个任意的字符序列。我需要C# regex匹配表达式来提取上述所有内容。
例如,投入是
<A HREF="f110111.ZIP"><A HREF="qqq.ZIP"><A HREF="gygu.ZIP">
我要名单:
发布于 2011-04-20 07:52:06
你需要的是赫姆拉格包装/!这将允许您以简单的方式读取HTML,并提供一种检索链接的简单方法。
发布于 2011-04-20 07:55:21
如果文件名中可以有多个点:
<A HREF="(^["]+?).zip如果文件名中没有点(就在zip之前),您可以使用一个更快的点:
<A HREF="(^[".]+)C#示例:
Pattern pattern = Pattern.compile("<A HREF=\"(^[\"]+?).zip");
Matcher matcher = pattern.matcher(buffer);
while (matcher.find()) {
// do something with: matcher.group(1)
}发布于 2011-04-20 07:50:09
不,不!不要使用Regex解析HTML!
尝试XML解析器。或者是XPath。
https://stackoverflow.com/questions/5727136
复制相似问题