如何将感叹号作为regex中URL的一部分
示例:收集器url是: bla1 bla2 http://www.peckale.com/#!contact/c11m6 bla3我需要找到URL:http://www.peckale.com/#!contact/c11m6
用regex。
我用的是经验:
((www\.|(http|https|ftp|news|file)+\:\/\/)?[_.a-zA-Z0-9-]+\.[a-zA-Z0-9\/_:@=.+?,##%&~-]*[^.|\'|\# |!|\(|?|,| |>|<|;|\)]*)但结果是:在#之后剪切url
向沙哈尔问好
发布于 2014-09-02 09:50:22
如果要匹配全文中的URL,请使用以下命令:
(?:www\.|(?:https?|ftp|news|file):\/\/)[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|]请注意,最后一个字符类确保如果URL是某个文本的一部分,则标点符号(如逗号或URL后的句号)不会被解释为URL的一部分。这个符号像感叹号(!)只有当它们位于URL的中间,但如果它们位于URL的末尾,则不匹配
看演示..。
http://regex101.com/r/uG0mD2/3
发布于 2014-09-02 10:00:08
只需从最后一个被否定的字符类!中删除[^.|\'|\# |!|\(|?|,| |>|<|;|\)]即可。
((www\.|(http|https|ftp|news|file)+\:\/\/)?[_.a-zA-Z0-9-]+\.[a-zA-Z0-9\/_:@=.+?,##%&~-]*[^.|\'|\#|\(|?|,| |>|<|;|\)]*)演示
我的建议是,您不需要在字符类中包含|符号。
所以这个[^.|\'|\#|\(|?|,| |>|<|;|\)]被证明是[^.'#\(?, ><;\)]
https://stackoverflow.com/questions/25619380
复制相似问题