我有一个公司网站的字符串列表。
这是一个例子:'www.apple.com/about','go-sharp.ai/services','http.titos.com.br‘
我需要将它们替换为主页。
结果必须是:'www.apple.com','go-sharp.ai','http.titos.com.br‘
你能建议一下最好的方法吗(可能是一些API)。
谢谢您抽时间见我!
发布于 2021-11-09 13:16:45
一种方法:使用split方法
array=['www.apple.com/about', 'go-sharp.ai/services', 'http.titos.com.br']
result=[]
for ar in array:
result.append(ar.split("/")[0])
print(result)输出:['www.apple.com', 'go-sharp.ai', 'http.titos.com.br']
发布于 2021-11-09 13:20:58
通过您的示例,您可以很容易地创建一个简单的解析器,如下所示:
sites = ['www.apple.com/about', 'go-sharp.ai/services', 'http.titos.com.br']
for s in sites:
print(s.split('/')[0])正如@Be Chiller Too所说的,你也可以使用urllib.parse.urlparse,但要确保你的网站格式良好,即如文档所说:
遵循RFC1808中的语法规范,只有在“//”正确引入netloc时,urlparse才能识别它。否则,假设输入是相对URL,并因此以路径组件开始。
请参阅https://docs.python.org/3/library/urllib.parse.html#urllib.parse.urlparse
https://stackoverflow.com/questions/69898662
复制相似问题