首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python -获取TLD

Python -获取TLD
EN

Stack Overflow用户
提问于 2021-04-26 17:57:29
回答 3查看 90关注 0票数 0

我在应该从域中删除tld的函数中有一个问题。如果域有一些子域,它可以正常工作。例如:

输入:asdf.xyz.example.com

输出:asdf.xyz.example

问题是当域没有任何子域时,在域前面有一个点

输入:example.com

输出:.example

这是我的代码:

代码语言:javascript
复制
 res = get_tld(domain, as_object=True, fail_silently=True, fix_protocol=True)
 domain = '.'.join([res.subdomain, res.domain])

函数get_tld来自tld library

有人能帮我解决这个问题吗?

EN

回答 3

Stack Overflow用户

发布于 2021-04-26 18:01:35

通过一个非常简单的字符串操作,这就是你想要的吗?

代码语言:javascript
复制
d1 = 'asdf.xyz.example.com'
output = '.'.join(d1.split('.')[:-1])
# output = 'asdf.xyz.example'

d2 = 'example.com'
output = '.'.join(d2.split('.')[:-1])
# output = 'example'
票数 0
EN

Stack Overflow用户

发布于 2021-04-26 18:03:41

您可以使用过滤。看起来get_tld像预期的那样工作,但是join不正确

代码语言:javascript
复制
domain = '.'.join(filter(lambda x: len(x), [res.subdomain, res.domain]))
票数 0
EN

Stack Overflow用户

发布于 2021-04-26 18:05:01

另一个简单的版本是:

代码语言:javascript
复制
def remove_tld(url):
    *base, tld = url.split(".")
    return ".".join(base)


url = "asdf.xyz.example.com"
print(remove_tld(url))    # asdf.xyz.example

url = "example.com"
print(remove_tld(url))    # example

*base, tld = url.split(".")将TLD放在tld中,其他所有内容都放在base中。然后你只要用".".join(base) join tĥ就行了。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67264512

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档