我正在努力学习蟒蛇和葡萄牙语,所以我以为我可以一石二鸟。
下面是一个页面的例子。我想下载蓝色表格中的数据,所以第一个这样的表叫做Presente,下一个表叫做Pretérito Perfeito等等。
下面是我的代码,但是我正在挣扎。我的结果变量确实包含了我需要的数据,但是,由于div标记没有id,所以试图提取确切的位超出了我的范围。
有更好的方法吗?
import requests
from bs4 import BeautifulSoup
URL = 'https://conjugator.reverso.net/conjugation-portuguese-verb-ser.html'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
results = soup.find(id='ch_divSimple')
mychk = results.prettify()
tbl_elems = results.find_all('section', class_='wrap-verbs-listing')发布于 2020-03-29 12:42:18
他们没有ids,但他们有类。你可以:
results.find_all("div", "blue-box-wrap")其中blue-box-wrap是一个类。
它将返回一个长度为22的ResultSet对象,因为有22个蓝色表。您可以通过索引选择所需的索引,如下所示:
blue_tables = results.find_all("div", "blue-box-wrap")
blue_tables[0]发布于 2020-03-29 12:44:44
取代:
results = soup.find(id='ch_divSimple')
mychk = results.prettify()
tbl_elems = results.find_all('section', class_='wrap-verbs-listing')With:
results = soup.find("div", attrs={"class": 'blue-box-wrap'})
tbl_elems = results.find_all('ul', class_='wrap-verbs-listing')https://stackoverflow.com/questions/60914401
复制相似问题