文章/答案/技术大牛

发布

社区首页 >问答首页 >如何在Python中解析主机:端口对

问如何在Python中解析主机:端口对
EN

Stack Overflow用户

提问于 2017-10-22 16:54:46

回答 7查看 5.4K关注 0票数 10

假设我有一个host:port格式的字符串，其中:port是可选的。如何可靠地提取这两个组件？

主机可以是下列任何一种：

主机名(localhost，www.google.com)
IPv4文字(1.2.3.4)
IPv6文字([aaaa:bbbb::cccc])。

换句话说，这是在互联网上使用的标准格式(例如在URI中:在https://www.rfc-editor.org/rfc/rfc3986#section-3.2完成语法，不包括“用户信息”组件)。

因此，一些可能的输入和期望的输出：

'localhost' -> ('localhost', None)
'my-example.com:1234' -> ('my-example.com', 1234)
'1.2.3.4' -> ('1.2.3.4', None)
'[0abc:1def::1234]' -> ('[0abc:1def::1234]', None)

python

回答 7

Stack Overflow用户

回答已采纳

发布于 2017-10-22 23:15:21

这是我的最后一次尝试，感谢其他给出灵感的回答者：

def parse_hostport(s, default_port=None):
    if s[-1] == ']':
        # ipv6 literal (with no port)
        return (s, default_port)

    out = s.rsplit(":", 1)
    if len(out) == 1:
        # No port
        port = default_port
    else:
        try:
            port = int(out[1])
        except ValueError:
            raise ValueError("Invalid host:port '%s'" % s)

    return (out[0], port)

票数 1

Stack Overflow用户

发布于 2018-11-06 13:10:21

这是Python，里面有电池。您已经提到该格式是URI中使用的标准格式，那么urllib.parse如何？

import urllib.parse

def parse_hostport(hp):
    # urlparse() and urlsplit() insists on absolute URLs starting with "//"
    result = urllib.parse.urlsplit('//' + hp)
    return result.hostname, result.port

这应该可以处理任何可以抛出的有效host:port。

票数 11

Stack Overflow用户

发布于 2017-10-22 17:45:14

这应该在一个正则表达式中处理整个解析。

regex = re.compile(r'''
(                            # first capture group = Addr
  \[                         # literal open bracket                       IPv6
    [:a-fA-F0-9]+            # one or more of these characters
  \]                         # literal close bracket
  |                          # ALTERNATELY
  (?:                        #                                            IPv4
    \d{1,3}\.                # one to three digits followed by a period
  ){3}                       # ...repeated three times
  \d{1,3}                    # followed by one to three digits
  |                          # ALTERNATELY
  [-a-zA-Z0-9.]+              # one or more hostname chars ([-\w\d\.])      Hostname
)                            # end first capture group
(?:                          
  :                          # a literal :
  (                          # second capture group = PORT
    \d+                      # one or more digits
  )                          # end second capture group
 )?                          # ...or not.''', re.X)

那么所需要的就是将第二组转换为int。

def parse_hostport(hp):
    # regex from above should be defined here.
    m = regex.match(hp)
    addr, port = m.group(1, 2)
    try:
        return (addr, int(port))
    except TypeError:
        # port is None
        return (addr, None)

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46876770

复制

相似问题

问如何在Python中解析主机:端口对
EN

回答 7

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在Python中解析主机:端口对EN

回答 7

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在Python中解析主机:端口对
EN