首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法使用美汤提取网页数据

无法使用美汤提取网页数据
EN

Stack Overflow用户
提问于 2018-10-12 17:40:34
回答 1查看 34关注 0票数 1
代码语言:javascript
复制
  url =  "https://www.telegraph.co.uk/formula-1/2018/08/25/f1-live-belgian-grand-prix-2018-qualifying-latest-updates/"
  soup = bs(urlopen(url), "lxml")
  divs = soup.findAll('div')
  base_url = "https://www.telegraph.co.uk"
  images = []
  print (divs)
  []

我得到的输出是空的。我认为这个页面是动态加载的。如何从该页面提取div。

EN

回答 1

Stack Overflow用户

发布于 2018-10-12 18:21:49

页面内容由JS/动态加载,因此您必须使用selenium...you可以执行以下操作...

代码语言:javascript
复制
from bs4 import BeautifulSoup
from selenium import webdriver#you need to install selenium
from selenium.webdriver.chrome.options import Options

options = Options()
options.add_argument('--headless')
options.add_argument('--disable-gpu')
#copy your chromedriver to python folder
driver = webdriver.Chrome(chrome_options=options)
url =  ("https://www.telegraph.co.uk/"
"formula-1/2018/08/25/f1-live-belgian"
"-grand-prix-2018-qualifying-latest-updates/")
driver.get(url)
soup = BeautifulSoup(driver.page_source, 'lxml')
divs = soup.findAll('div')
print(divs)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52776709

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档