首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从网站地址字符串中获取HomePage

从网站地址字符串中获取HomePage
EN

Stack Overflow用户
提问于 2021-11-09 13:04:52
回答 2查看 28关注 0票数 0

我有一个公司网站的字符串列表。

这是一个例子:'www.apple.com/about','go-sharp.ai/services','http.titos.com.br‘

我需要将它们替换为主页。

结果必须是:'www.apple.com','go-sharp.ai','http.titos.com.br‘

你能建议一下最好的方法吗(可能是一些API)。

谢谢您抽时间见我!

EN

回答 2

Stack Overflow用户

发布于 2021-11-09 13:16:45

一种方法:使用split方法

代码语言:javascript
复制
array=['www.apple.com/about', 'go-sharp.ai/services', 'http.titos.com.br']
result=[]
for ar in array:
    result.append(ar.split("/")[0])
print(result)

输出:['www.apple.com', 'go-sharp.ai', 'http.titos.com.br']

票数 1
EN

Stack Overflow用户

发布于 2021-11-09 13:20:58

通过您的示例,您可以很容易地创建一个简单的解析器,如下所示:

代码语言:javascript
复制
sites = ['www.apple.com/about', 'go-sharp.ai/services', 'http.titos.com.br']
for s in sites:
    print(s.split('/')[0])

正如@Be Chiller Too所说的,你也可以使用urllib.parse.urlparse,但要确保你的网站格式良好,即如文档所说:

遵循RFC1808中的语法规范,只有在“//”正确引入netloc时,urlparse才能识别它。否则,假设输入是相对URL,并因此以路径组件开始。

请参阅https://docs.python.org/3/library/urllib.parse.html#urllib.parse.urlparse

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69898662

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档