首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从span标签中获取youtube链接。BeautifulSoup

从span标签中获取youtube链接。BeautifulSoup
EN

Stack Overflow用户
提问于 2021-06-25 04:59:06
回答 1查看 22关注 0票数 0

我正在尝试找到一种方法来收集嵌入BeautifulSoup的youtube链接。下面是一段html的示例。

代码语言:javascript
复制
<span data-s9e-mediaembed="youtube"><span><span data-s9e-mediaembed-iframe='["allowfullscreen","","scrolling","no","style","background:url(https://i.ytimg.com/vi/-OQ2mQRB9E4/hqdefault.jpg) 50% 50% / cover","src","https://www.youtube.com/embed/-OQ2mQRB9E4"]' style="background:url(https://i.ytimg.com/vi/-OQ2mQRB9E4/hqdefault.jpg) 50% 50% / cover"></span></span></span> 

如何隔离带有youtube链接的span标记,然后解析出youtube链接?

我尝试用youtube链接隔离跨度,如下所示,但它仍然打印所有跨度。

代码语言:javascript
复制
r = requests.get(url)
r_html = r.text
soup = BeautifulSoup(r_html, 'html.parser')

vids = soup.find_all("span")

videolist=[]

for i in range (0,len(vids)):

    if vids[i].find("www.youtube.com") != -1:
        videolist.append(vids[i])


for i in videolist:
    print(i)
EN

回答 1

Stack Overflow用户

发布于 2021-06-25 05:07:12

如果使用正则表达式查找所有包含YouTube的href会怎么样呢

代码语言:javascript
复制
import re

r = requests.get(url)
r_html = r.text
soup = BeautifulSoup(r_html, 'html.parser')

vids = soup.find_all('span', string=re.compile('youtube')

for a in vids:
    print(a['href'])
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68122697

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档