我是Python的新手,我在网上看过很多关于web抓取的教程视频。
这是来自目标网站的元素:
<span class="status ng-binding"> 14 </span>这是我的代码:
import requests
import bs4
headers = {"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36'}
res = requests.get('https://gleam.io/cevFk/castrio-october-streaming-pc-giveaway?gsr=cevFk-SxAtZtT4Ir', headers=headers)
soup = bs4.BeautifulSoup(res.text, 'html.parser')
print(soup.select("#status ng-binding"))我正在尝试从目标网站提取/输出数字(即14)。我做错了什么吗?任何答案都是非常感谢的。
发布于 2019-10-19 15:44:25
类(‘soup.find’,{'class':'classname'},recursive=True).text
可以添加更多属性:{'attr':'value','attr':'value'}
find_all()返回在嵌套标记中重新搜索的列表
发布于 2019-10-19 16:12:29
问题是原始响应中缺少预期的跨度。
您可以按照以下步骤进行验证。
response = requests.get(url, headers)
soup = bs4.BeautifulSoup(response.text, 'html.parser')
#print soup.prettify()
# print(soup.prettify())
print('title',soup.title)
print('fiind all spans', soup.find_all('span'))https://stackoverflow.com/questions/58461407
复制相似问题