文章/答案/技术大牛

发布

社区首页 >问答首页 >如何使用python将音频缓冲区传递到语音到文本服务

问如何使用python将音频缓冲区传递到语音到文本服务
EN

Stack Overflow用户

提问于 2021-03-03 17:33:35

回答 1查看 323关注 0票数 1

我正在使用蔚蓝的语音文字服务，使用python处理大量的音频。为了处理音频，以下是执行的步骤-

从web服务器下载音频到本地的‘C:/音频’驱动器。
将下载的音频路径传递到Speech的- Audioconfig(filename =‘C:/音频/my_audo.wav’)

与其下载到本地机器，我希望从服务器获取文件，并将其直接传递到语音到文本服务。对此，

我将音频以bytes形式存储在音频缓冲区中，如- raw_audio = my_audio_in_bytes # class <'bytes'>
然后，我将音频缓冲区传递给AudioConfig(filename = raw_audio) -它不工作。因为它需要一个filepath

有没有办法将音频缓冲区传递给该服务？

配置python代码：

speech_config = speechsdk.SpeechConfig(subscription=speech_key, region=service_region)
audio_config = speechsdk.audio.AudioConfig(filename='C:/audios/audio1.wav')
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_config=audio_config)

python

speech-to-text

azure-speech

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-04 02:18:43

@ use 1990，根据我们的讨论关于这个GitHub问题，请使用批量转录，因为Speech不支持从托管在web服务上的WAV文件中直接识别(您首先需要在本地下载它)。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66462048

复制

相似问题

问如何使用python将音频缓冲区传递到语音到文本服务
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用python将音频缓冲区传递到语音到文本服务EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用python将音频缓冲区传递到语音到文本服务
EN