首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用python将音频缓冲区传递到语音到文本服务

如何使用python将音频缓冲区传递到语音到文本服务
EN

Stack Overflow用户
提问于 2021-03-03 17:33:35
回答 1查看 323关注 0票数 1

我正在使用蔚蓝的语音文字服务,使用python处理大量的音频。为了处理音频,以下是执行的步骤-

  1. 从web服务器下载音频到本地的‘C:/音频’驱动器。
  2. 将下载的音频路径传递到Speech的- Audioconfig(filename =‘C:/音频/my_audo.wav’)

与其下载到本地机器,我希望从服务器获取文件,并将其直接传递到语音到文本服务。对此,

  1. 我将音频以bytes形式存储在音频缓冲区中,如- raw_audio = my_audio_in_bytes # class <'bytes'>
  2. 然后,我将音频缓冲区传递给AudioConfig(filename = raw_audio) -它不工作。因为它需要一个filepath

有没有办法将音频缓冲区传递给该服务?

配置python代码:

代码语言:javascript
复制
speech_config = speechsdk.SpeechConfig(subscription=speech_key, region=service_region)
audio_config = speechsdk.audio.AudioConfig(filename='C:/audios/audio1.wav')
speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config, audio_config=audio_config)  
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-04 02:18:43

@ use 1990,根据我们的讨论关于这个GitHub问题,请使用批量转录,因为Speech不支持从托管在web服务上的WAV文件中直接识别(您首先需要在本地下载它)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66462048

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档