问如何从带有错误时间戳的YouTube字幕中生成有效的时间戳？(使用管)
EN

Stack Overflow用户

提问于 2022-11-05 19:21:40

回答 1查看 45关注 0票数 0

使用pytube，我尝试下载一个YouTube视频，翻译字幕并将翻译后的字幕嵌入到视频中，然后下载到我的PC上。

这是我代码的一部分，修改后的代码很容易理解。

from pytube import YouTube as YT
yt = YT("https://www.youtube.com/watch?v=ZFGAz6vZx1E")

caption_code = ''
try:
  captions = yt.captions['en']
  caption_code = 'en'
except:
  try:
    captions = yt.captions['a.en']
    caption_code = 'a.en'
  except Exception as e:
    raise e

captions = yt.captions.get_by_language_code(caption_code)
test_captions(captions)

### just a function to test how's the cations are structured.
def test_captions(captions):
  caption_list = []
  index = 0

  for line in str(captions.generate_srt_captions()).split('\n'):
    if index == 0:
      caption_list.append({})

    if index in (1, 2):
      caption_list[len(caption_list)-1][('time', 'caption')[index-1]] = line
      index += 1

    if line == '':
      index = 0

  for dic in caption_list:
    print('{} : {}'.format(dic['time'], dic['caption']))

在最初的YouTube视频中，标题开始于第1秒(应在00:00:01,000左右)