首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Selenium -使用python从html获取音频src

Selenium -使用python从html获取音频src
EN

Stack Overflow用户
提问于 2020-08-07 15:15:30
回答 1查看 1.2K关注 0票数 0

我正在尝试使用selenium从recaptcha音频源获取特定的属性。

然而,我不知道如何做到这一点。下面是来自https://www.google.com/recaptcha/api2/demo的一个示例

  1. 点击“我不是机器人”

  1. 选择耳机

  1. 提取src链接

我想检索src链接并打印出来。

我想知道是否有什么方法可以让我使用selenium来做到这一点?

到目前为止,我的代码允许我加载到recaptcha演示页面->上,单击“我不是机器人”->点击音频按钮

代码语言:javascript
复制
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

import time

PATH="C:\Program Files (x86)\chromedriver.exe"
driver = webdriver.Chrome(PATH)
driver.get("http://localhost/recaptcha-v2/")
# driver.get("https://www.google.com/recaptcha/api2/demo")


WebDriverWait(driver, 10).until(EC.frame_to_be_available_and_switch_to_it((By.CSS_SELECTOR,"iframe[src^='https://www.google.com/recaptcha/api2/anchor']")))
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.CSS_SELECTOR, "span#recaptcha-anchor"))).click()
driver.switch_to.default_content()
WebDriverWait(driver, 10).until(EC.frame_to_be_available_and_switch_to_it((By.CSS_SELECTOR,"iframe[title='recaptcha challenge']")))
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.CSS_SELECTOR, "button#recaptcha-audio-button"))).click()


#This works, i can get the captcha token
# Src_URL = driver.find_element_by_id('recaptcha-token').get_attribute('value')

#This does not work, it can't locate the src
WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.ID, "audio-source")))
Src_URL = driver.find_element_by_id('audio-source').get_attribute('src')
print(Src_URL)

请指教谢谢!

EN

回答 1

Stack Overflow用户

发布于 2020-08-08 08:38:23

我使用下面的代码从src标记中提取audio属性(如果audio标记位于另一个iframe中,则更改iframe )-

代码语言:javascript
复制
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver import ActionChains
import time

driver = webdriver.Chrome()
wait = WebDriverWait(driver, 5)
action = ActionChains(driver)

driver.get("YourURL")

# you can also use time.sleep(5)
wait.until(expected_conditions.presence_of_element_located((By.ID, "audio-source")))
Src_URL = driver.find_element_by_id('audio-source').get_attribute('src')

print(Src_URL)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63304606

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档