首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Youtube作为语音识别数据集

使用Youtube作为语音识别数据集
EN

Software Recommendation用户
提问于 2018-12-21 17:12:09
回答 1查看 35关注 0票数 0

DNNs是一种巨大的数据需求算法,尤其是双向LSTM算法.对于语音识别模型,对于特定的语言/口音,缺少语音语料库。然而,YouTube也是一个巨大的库。

我需要使用一些脚本/软件,它可以自动下载YouTube视频(可能只有音频)和相关的字幕,然后将其分割成20秒的片段,这样就可以用作训练语音语料库。

有没有任何方式可以下载来自Youtube的字幕?给出一个音频和脚本,我如何将一个音频分割成20秒的片段,并在文字记录中做同样的剪辑?

EN

回答 1

Software Recommendation用户

发布于 2022-03-02 22:07:24

undefined (或youtube-dl或youtube-dl的另一个分支)

  1. 可以从YouTube和/或许多其他网站下载视频和/或音频和/或字幕和/或其他数据。
  2. 很容易选择你想要瞄准的视频。注意诸如“--匹配-过滤器”之类的选项,用于过滤几乎任何属性和“-批处理文件”,这将下载命名文件中的URL列表。
  3. 很容易抓取大部分信息而不下载视频。例如,参见“--跳过-下载”
  4. 许多选项显式的字幕:见下文。特别要注意的是,您可以区分机器生成的自动字幕和人工上传的文件,这并不意味着它们是精确的或由人生成的,只是YouTube没有将它们放在那个位置。
  5. 您可以丢弃视频,只保留音频。例如,参见“--提取-音频”

字幕选项:

代码语言:javascript
复制
--write-subs                     Write subtitle file
--no-write-subs                  Do not write subtitle file (default)
--write-auto-subs                Write automatically generated subtitle file
                                 (Alias: --write-automatic-subs)
--no-write-auto-subs             Do not write auto-generated subtitles
                                 (default) (Alias: --no-write-automatic-subs)
--list-subs                      List available subtitles of each video.
                                 Simulate unless --no-simulate is used
--sub-format FORMAT              Subtitle format, accepts formats
                                 preference, for example: "srt" or
                                 "ass/srt/best"
--sub-langs LANGS                Languages of the subtitles to download (can
                                 be regex) or "all" separated by commas.
                                 (Eg: --sub-langs "en.*,ja") You can prefix
                                 the language code with a "-" to exempt it
                                 from the requested languages. (Eg:
                                 --sub-langs all,-live_chat) Use --list-subs
                                 for a list of available language tags

FFmpeg

  1. 只要稍微聪明一点,你就可以创建任意长度的音频片段及其相关的字幕。例如,请参见此页描述如何删除视频文件的前五分钟,并删除相应字幕文件的前五分钟。
  2. 非常擅长把媒体转换成你想要的编解码器。
  3. 如果配置正确(这并不总是显而易见的方法),它擅长创建具有精确时间长度的文件。
  4. 快地。免费的。开源的。多平台。可扩展的。

这个问题已经有三年了,所以我想OP已经找到了很多选择。但是也许这会对其他人有所帮助。

票数 0
EN
页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwarerecs.stackexchange.com/questions/53834

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档