文章/答案/技术大牛

发布

社区首页 >问答首页 >从网站地址字符串中获取HomePage

问从网站地址字符串中获取HomePage
EN

Stack Overflow用户

提问于 2021-11-09 13:04:52

回答 2查看 28关注 0票数 0

我有一个公司网站的字符串列表。

这是一个例子：'www.apple.com/about'，'go-sharp.ai/services'，'http.titos.com.br‘

我需要将它们替换为主页。

结果必须是：'www.apple.com'，'go-sharp.ai'，'http.titos.com.br‘

你能建议一下最好的方法吗(可能是一些API)。

谢谢您抽时间见我!

python

arrays

string

nlp

text-mining

回答 2

Stack Overflow用户

发布于 2021-11-09 13:16:45

一种方法:使用split方法

array=['www.apple.com/about', 'go-sharp.ai/services', 'http.titos.com.br']
result=[]
for ar in array:
    result.append(ar.split("/")[0])
print(result)

输出：['www.apple.com', 'go-sharp.ai', 'http.titos.com.br']

票数 1

Stack Overflow用户

发布于 2021-11-09 13:20:58

通过您的示例，您可以很容易地创建一个简单的解析器，如下所示：

sites = ['www.apple.com/about', 'go-sharp.ai/services', 'http.titos.com.br']
for s in sites:
    print(s.split('/')[0])

正如@Be Chiller Too所说的，你也可以使用urllib.parse.urlparse，但要确保你的网站格式良好，即如文档所说：

遵循RFC1808中的语法规范，只有在“//”正确引入netloc时，urlparse才能识别它。否则，假设输入是相对URL，并因此以路径组件开始。

请参阅https://docs.python.org/3/library/urllib.parse.html#urllib.parse.urlparse

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69898662

复制

相似问题

问从网站地址字符串中获取HomePage
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从网站地址字符串中获取HomePageEN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从网站地址字符串中获取HomePage
EN