请记住,据我所知,Microsoft/Azure Cognitive Services的"Speech Service“目前正在进行一次理性化的工作。
https://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/rest-apis#speech-to-text
https://docs.microsoft.com/en-us/azure/cognitive-services/speech/home
只有.wav二进制文件是可接受的,其他任何文件都可以提供响应:
{"Message":"Unsupported audio format"}有没有其他方法可以发现可接受的音频格式/编码/等,或者这就是它?
关于在python pydub中预处理任意/.m4a音频格式以使其达到标准的技巧的加分-目前适用于.mp3,但不适用于.m4a。
谢谢!
发布于 2018-08-14 05:35:47
当前支持的格式为single-channel (mono) WAV / PCM with a sampling rate of 16 kHz。未来将添加更多的格式和编解码器支持。
https://stackoverflow.com/questions/51614216
复制相似问题