首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python - regexp检查字符串是否为TLD域

Python - regexp检查字符串是否为TLD域
EN

Stack Overflow用户
提问于 2014-07-06 09:16:58
回答 2查看 1.3K关注 0票数 0

我有表单的字段,它接受表示波兰域名的字符串(以.pl结尾)

我要查一下:

  1. 如果字符串是正确的波兰域名(以.pl结尾)
  2. 域为顶级(即: domainname.pl)或第二层: domainname.net.pl、domainname.something.pl。

您有什么建议这样的regexp应该是什么样子吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-07-06 09:19:33

您无法将所有可能的顶级域与regex匹配,TLD的列表也会不时更改。

使用库来提取TLD,比如tldextractpublicsuffix

演示:

代码语言:javascript
复制
>>> import tldextract
>>> tldextract.extract('domainname.net.pl')
ExtractResult(subdomain='', domain='domainname', suffix='net.pl')
>>> tldextract.extract('www.domainname.net.pl')
ExtractResult(subdomain='www', domain='domainname', suffix='net.pl')
>>> from publicsuffix import PublicSuffixList
>>> psl = PublicSuffixList()
>>> psl.get_public_suffix('domainname.net.pl')
'domainname.net.pl'
>>> psl.get_public_suffix('www.domainname.net.pl')
'domainname.net.pl'

tldextract给出了一个解析的结果,而publicsuffix仅仅给出了仍然被认为是一个实体的域名。

票数 4
EN

Stack Overflow用户

发布于 2014-07-06 09:27:01

如果你真的需要一个正则表达式,我会用这样的方法:

代码语言:javascript
复制
^([a-z0-9-]+.)?([a-z0-9-]+).pl$
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24594351

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档