文章/答案/技术大牛

发布

社区首页 >问答首页 >Azure认知服务的语音服务(SST)支持哪些音频格式？

问Azure认知服务的语音服务(SST)支持哪些音频格式？
EN

Stack Overflow用户

提问于 2018-07-31 21:11:02

回答 1查看 2.1K关注 0票数 2

请记住，据我所知，Microsoft/Azure Cognitive Services的"Speech Service“目前正在进行一次理性化的工作。

https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-apis#speech-to-text

https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home

只有.wav二进制文件是可接受的，其他任何文件都可以提供响应：

{"Message":"Unsupported audio format"}

有没有其他方法可以发现可接受的音频格式/编码/等，或者这就是它？

关于在python pydub中预处理任意/.m4a音频格式以使其达到标准的技巧的加分-目前适用于.mp3，但不适用于.m4a。

谢谢!

microsoft-cognitive

azure-cognitive-services

pydub

python

speech-to-text

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-14 05:35:47

当前支持的格式为single-channel (mono) WAV / PCM with a sampling rate of 16 kHz。未来将添加更多的格式和编解码器支持。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51614216

复制

相似问题

问Azure认知服务的语音服务(SST)支持哪些音频格式？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Azure认知服务的语音服务(SST)支持哪些音频格式？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Azure认知服务的语音服务(SST)支持哪些音频格式？
EN