首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用bs4/python3提取href?(再次)

使用bs4/python3提取href?(再次)
EN

Stack Overflow用户
提问于 2017-07-14 21:14:59
回答 1查看 86关注 0票数 0

很抱歉转载这个问题。有人将问题转移到了另一个网站,没有我无法评论或编辑的cookies。

我是python和bs4的新手,请对我手下留情。

代码语言:javascript
复制
#!/usr/bin/python3
import bs4 as bs
import urllib.request
import time, datetime, os, requests, lxml.html
import re
from fake_useragent import UserAgent

url = "https://www.cvedetails.com/vulnerability-list.php"
ua = UserAgent()
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'}
snkr = requests.get(url,headers=header)
soup = bs.BeautifulSoup(snkr.content,'lxml')

for item in soup.find_all('tr', class_="srrowns"):
    print(item.td.next_sibling.next_sibling.a)

打印:

代码语言:javascript
复制
<a href="/cve/CVE-2017-6712/" title="CVE-2017-6712 security vulnerability details">CVE-2017-6712</a>
<a href="/cve/CVE-2017-6708/" title="CVE-2017-6708 security vulnerability details">CVE-2017-6708</a>
<a href="/cve/CVE-2017-6707/" title="CVE-2017-6707 security vulnerability details">CVE-2017-6707</a>
<a href="/cve/CVE-2017-1269/" title="CVE-2017-1269 security vulnerability details">CVE-2017-1269</a>
<a href="/cve/CVE-2017-0711/" title="CVE-2017-0711 security vulnerability details">CVE-2017-0711</a>
<a href="/cve/CVE-2017-0706/" title="CVE-2017-0706 security vulnerability details">CVE-2017-0706</a>

使用推荐的字符串:

代码语言:javascript
复制
print(item.td.next_sibling.next_sibling.a.href)

打印:

代码语言:javascript
复制
None
None
None
None
None
None

无法确定如何提取/cve/CVE-2017-XXXX/部件。也许我做错了。我不需要标题或html,只需要uri。

EN

回答 1

Stack Overflow用户

发布于 2017-07-14 21:17:27

我认为你应该尝试一下这样的东西:

代码语言:javascript
复制
for item in soup.find_all('tr', class_="srrowns"):
    print(item.td.next_sibling.next_sibling.a['href'])
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45103984

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档