首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Azure认知服务的语音服务(SST)支持哪些音频格式?

Azure认知服务的语音服务(SST)支持哪些音频格式?
EN

Stack Overflow用户
提问于 2018-07-31 21:11:02
回答 1查看 2.1K关注 0票数 2

请记住,据我所知,Microsoft/Azure Cognitive Services的"Speech Service“目前正在进行一次理性化的工作。

https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-apis#speech-to-text

https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home

只有.wav二进制文件是可接受的,其他任何文件都可以提供响应:

代码语言:javascript
复制
{"Message":"Unsupported audio format"}

有没有其他方法可以发现可接受的音频格式/编码/等,或者这就是它?

关于在python pydub中预处理任意/.m4a音频格式以使其达到标准的技巧的加分-目前适用于.mp3,但不适用于.m4a

谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-14 05:35:47

当前支持的格式为single-channel (mono) WAV / PCM with a sampling rate of 16 kHz。未来将添加更多的格式和编解码器支持。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51614216

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档