<li class="a-last"><a href="/macbook-pro">Buy Now</a></li>如何提取类/macbook-pro中的链接a-last?效率是一个考虑因素。
发布于 2019-08-14 08:17:54
一种可能是CSS选择器:
data = '''<li class="a-last"><a href="/macbook-pro">Buy Now</a></li>'''
from bs4 import BeautifulSoup
soup = BeautifulSoup(data, 'lxml')
print(soup.select_one('li.a-last [href]')['href'])指纹:
/macbook-proli.a-last [href]将选择属性为href的标记,该标记位于带有类a-last的<li>标记下。
如果您希望更具体,并且只希望在<a>下直接提取<li class="a-last">标记,则可以使用:
print(soup.select_one('li.a-last > a[href]')['href'])发布于 2019-08-14 08:17:16
你可以这样做:
from bs4 import BeautifulSoup
html = """<li class="a-last"><a href="/macbook-pro">Buy Now</a></li>"""
soup = BeautifulSoup(html, 'html.parser')
href = soup.find('li', {'class': 'a-last'}).find('a').get('href')
print(href)结果:
/macbook-pro发布于 2019-08-14 08:26:14
这是所有需要的参考文献的清单:
[el.find('a').get('href') for el in soup.find_all('li', {'class': 'a-last'})]
https://stackoverflow.com/questions/57490743
复制相似问题