我想为即将到来的项目刮掉tiktok视频的持续时间,但我的代码不起作用
import requests; from bs4 import BeautifulSoup
content = requests.get('https://vm.tiktok.com/ZMFFKmx3K/').text
soup = BeautifulSoup(content, 'lxml')
data = soup.find('div', class_="tiktok-1g3unbt-DivSeekBarTimeContainer e123m2eu1")
print(data)使用一个例子tiktok

我想这会有用的,谁能帮上忙
发布于 2022-10-07 13:48:53
如果关闭JavaScript,然后查看chrome中的元素选择,那么您将看到值为00/000,但是当您将打开Js并且视频处于播放模式时,持续时间就会增加,uoto finishig.So,该元素的实际持续时间值取决于JS。因此,您必须使用自动化工具(比如selenium )来获取这个动态值。如果您使用selenium,那么依赖于time.sleep()的抓取时间将有多长。如果time.sleep大于视频长度,那么它将不显示任何typEerror。
示例:
import time
from selenium import webdriver
from bs4 import BeautifulSoup
from selenium.webdriver.chrome.service import Service
webdriver_service = Service("./chromedriver") #Your chromedriver path
driver = webdriver.Chrome(service=webdriver_service)
url ='https://vm.tiktok.com/ZMFFKmx3K/'
driver.get(url)
driver.maximize_window()
time.sleep(25)
soup = BeautifulSoup(driver.page_source,"lxml")
data = soup.find('div', class_="tiktok-1g3unbt-DivSeekBarTimeContainer e123m2eu1")
print(data.text)输出:
00:25/00:28发布于 2022-10-07 00:25:18
相关的ID很可能是随机的。尝试使用regex按类获取元素,以'TimeContainer‘+其他id结尾
import requests
from bs4 import BeautifulSoup
import re
content = requests.get('https://vm.tiktok.com/ZMFFKmx3K/').text
soup = BeautifulSoup(content, 'lxml')
data = soup.find('div', {'class': re.compile(r'TimeContainer.*$')})
print(data)下一个问题是,页面在视频之前加载,所以您将得到0/0的时间。尝试硒,这样您就可以添加等待加载的计时器
https://stackoverflow.com/questions/73981105
复制相似问题