文章/答案/技术大牛

发布

社区首页 >问答首页 >本地视频中的SFSpeechRecognizer

问本地视频中的SFSpeechRecognizer
EN

Stack Overflow用户

提问于 2022-05-10 12:29:44

回答 1查看 274关注 0票数 1

我正在尝试从视频中实现语音转录(语音到文本)。我的方法是将其分解为三个步骤：

将视频转换为音频文件(m4a/mp3)
用音频文件url
Prase将音频传递给SFSpeechRecognizer请求结果

我的问题是，我还没有找到将原始视频文件(比如.mov)转换为仅音频文件的方法。视频的AVAsset本身没有任何音频音轨，但在播放文件时仍然有音频(因此它确实存在)。

我想，如果我能解决第一步，那么2+3是微不足道的，所以我的问题是-什么是最好的方式将一个视频文件转换成一个音频文件，然后我可以用来转录。

ios

swift

audio

avfoundation

speech-recognition

回答 1

Stack Overflow用户

发布于 2022-05-11 20:01:09

您可以使用FFmpegKit库提取视频的音频部分。

库示例：https://github.com/tanersener/ffmpeg-kit/tree/main/apple#3-using

提取音频的ffmpeg命令示例：https://stackoverflow.com/a/27413824/5707560

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72186339

复制

相似问题

问本地视频中的SFSpeechRecognizer
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问本地视频中的SFSpeechRecognizerEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问本地视频中的SFSpeechRecognizer
EN