首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从c#中的字符串中提取不完整的url

如何从c#中的字符串中提取不完整的url
EN

Stack Overflow用户
提问于 2022-06-14 13:07:59
回答 1查看 101关注 0票数 -1

我正在尝试从字符串中提取一些不完整的URL。让我举一个例子来说明我所说的不完全URL的含义:

代码语言:javascript
复制
tny.sh/FJFCG8w
gka.co/cte3
google.com
cdn.ne/ecoe3

我已经检查了一些使用regex来检测前缀的解决方案,比如HTTP之类的。但是上面提到的链接是没有前缀的链接.那么它有可能这样做吗?

这是我尝试用它在字符串中提取URL的方法:

代码语言:javascript
复制
protected LinkedList<string> ExtractLink(string txt)
{
    var linkParser = new Regex(@"\b(?:https?://|www\.)\S+\b", RegexOptions.Compiled | RegexOptions.IgnoreCase);
    LinkedList<string> urls = new LinkedList<string>();

    foreach (Match m in linkParser.Matches(txt))
        urls.AddFirst(m.Value);

    return urls;
    }

这是调用该方法的一个示例:

代码语言:javascript
复制
ExtractLink("Hello, this is the link that you need to check tny.sh/FJFCG8w");
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-06-16 18:41:59

您可以使用这个regex代替

代码语言:javascript
复制
[-a-zA-Z0-9@:%._\+~#=]{2,256}\.[a-z]{2,6}([-a-zA-Z0-9@:%_\+.~#?&\/=])*

如果您还想将urls与http(s)协议匹配,请使用以下命令

代码语言:javascript
复制
(https?:\/\/)?[-a-zA-Z0-9@:%._\+~#=]{2,256}\.[a-z]{2,6}([-a-zA-Z0-9@:%_\+.~#?&\/=])*
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72617539

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档