文章/答案/技术大牛

发布

社区首页 >问答首页 >使用Youtube作为语音识别数据集

问使用Youtube作为语音识别数据集
EN

Software Recommendation用户

提问于 2018-12-21 17:12:09

回答 1查看 35关注 0票数 0

DNNs是一种巨大的数据需求算法，尤其是双向LSTM算法.对于语音识别模型，对于特定的语言/口音，缺少语音语料库。然而，YouTube也是一个巨大的库。

我需要使用一些脚本/软件，它可以自动下载YouTube视频(可能只有音频)和相关的字幕，然后将其分割成20秒的片段，这样就可以用作训练语音语料库。

有没有任何方式可以下载来自Youtube的字幕？给出一个音频和脚本，我如何将一个音频分割成20秒的片段，并在文字记录中做同样的剪辑？

youtube

speech-recognition

回答 1

Software Recommendation用户

发布于 2022-03-02 22:07:24

undefined (或youtube-dl或youtube-dl的另一个分支)

可以从YouTube和/或许多其他网站下载视频和/或音频和/或字幕和/或其他数据。
很容易选择你想要瞄准的视频。注意诸如“--匹配-过滤器”之类的选项，用于过滤几乎任何属性和“-批处理文件”，这将下载命名文件中的URL列表。
很容易抓取大部分信息而不下载视频。例如，参见“--跳过-下载”
许多选项显式的字幕:见下文。特别要注意的是，您可以区分机器生成的自动字幕和人工上传的文件，这并不意味着它们是精确的或由人生成的，只是YouTube没有将它们放在那个位置。
您可以丢弃视频，只保留音频。例如，参见“--提取-音频”

字幕选项：

--write-subs                     Write subtitle file
--no-write-subs                  Do not write subtitle file (default)
--write-auto-subs                Write automatically generated subtitle file
                                 (Alias: --write-automatic-subs)
--no-write-auto-subs             Do not write auto-generated subtitles
                                 (default) (Alias: --no-write-automatic-subs)
--list-subs                      List available subtitles of each video.
                                 Simulate unless --no-simulate is used
--sub-format FORMAT              Subtitle format, accepts formats
                                 preference, for example: "srt" or
                                 "ass/srt/best"
--sub-langs LANGS                Languages of the subtitles to download (can
                                 be regex) or "all" separated by commas.
                                 (Eg: --sub-langs "en.*,ja") You can prefix
                                 the language code with a "-" to exempt it
                                 from the requested languages. (Eg:
                                 --sub-langs all,-live_chat) Use --list-subs
                                 for a list of available language tags

FFmpeg

只要稍微聪明一点，你就可以创建任意长度的音频片段及其相关的字幕。例如，请参见此页描述如何删除视频文件的前五分钟，并删除相应字幕文件的前五分钟。
非常擅长把媒体转换成你想要的编解码器。
如果配置正确(这并不总是显而易见的方法)，它擅长创建具有精确时间长度的文件。
快地。免费的。开源的。多平台。可扩展的。

这个问题已经有三年了，所以我想OP已经找到了很多选择。但是也许这会对其他人有所帮助。

票数 0

页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://softwarerecs.stackexchange.com/questions/53834

复制

相似问题

问使用Youtube作为语音识别数据集
EN

回答 1

Software Recommendation用户

undefined (或youtube-dl或youtube-dl的另一个分支)

字幕选项：

FFmpeg

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Youtube作为语音识别数据集EN

回答 1

Software Recommendation用户

undefined (或youtube-dl或youtube-dl的另一个分支)

字幕选项：

FFmpeg

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Youtube作为语音识别数据集
EN