文章/答案/技术大牛

发布

社区首页 >问答首页 >BeautifulSoup，findAll，findAll之后？

问BeautifulSoup，findAll，findAll之后？
EN

Stack Overflow用户

提问于 2016-09-13 20:58:01

回答 2查看 7.3K关注 0票数 2

我对Python非常陌生，主要是为了从网站获取信息。在这里，我试图从网站的底部得到简短的标题，但无法完全得到它们。

from bfs4 import BeautifulSoup
import requests

url = "http://some-website"
r = requests.get(url)
soup = BeautifulSoup(r.content, "html.parser")

nachrichten = soup.findAll('ul', {'class':'list'})

现在我需要另一个findAll来从var "nachrichten“获取所有的链接/a，但是我如何做到这一点呢？

beautifulsoup

python-requests

python

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-09-13 21:10:14

如果要在单个列表中使用所有链接，请使用带有select的css选择器：

anchors = soup.select('ul.list a')

如果您想要个人列表：

anchors = [ ul.find_all(a) for a in soup.find_all('ul', {'class':'list'})]

另外，如果您想要href，您可以确保只找到具有href属性的锚，并提取：

hrefs = [a["href"] for a in soup.select('ul.list a[href]')]

使用find_all set href=True i.e ul.find_all(a, href=True)。

票数 1

Stack Overflow用户

发布于 2016-09-13 21:13:15

from bs4 import BeautifulSoup
import requests
url = "http://www.n-tv.de/ticker/"
r = requests.get(url)
soup = BeautifulSoup(r.content, "html.parser")
nachrichten = soup.findAll('ul', {'class':'list'})
links = []
for ul in nachrichten:
    links.extend(ul.findAll('a'))
print len(links)

希望这能解决您的问题，我认为导入的是bs4。我从来不吃bfs4

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/39478865

复制

相似问题

问BeautifulSoup，findAll，findAll之后？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问BeautifulSoup，findAll，findAll之后？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问BeautifulSoup，findAll，findAll之后？
EN