首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >本地视频中的SFSpeechRecognizer

本地视频中的SFSpeechRecognizer
EN

Stack Overflow用户
提问于 2022-05-10 12:29:44
回答 1查看 274关注 0票数 1

我正在尝试从视频中实现语音转录(语音到文本)。我的方法是将其分解为三个步骤:

  1. 将视频转换为音频文件(m4a/mp3)
  2. 用音频文件url
  3. Prase将音频传递给SFSpeechRecognizer请求结果

我的问题是,我还没有找到将原始视频文件(比如.mov)转换为仅音频文件的方法。视频的AVAsset本身没有任何音频音轨,但在播放文件时仍然有音频(因此它确实存在)。

我想,如果我能解决第一步,那么2+3是微不足道的,所以我的问题是-什么是最好的方式将一个视频文件转换成一个音频文件,然后我可以用来转录。

EN

回答 1

Stack Overflow用户

发布于 2022-05-11 20:01:09

您可以使用FFmpegKit库提取视频的音频部分。

库示例:https://github.com/tanersener/ffmpeg-kit/tree/main/apple#3-using

提取音频的ffmpeg命令示例:https://stackoverflow.com/a/27413824/5707560

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72186339

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档