首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Google语音到文本API响应不返回单词

Google语音到文本API响应不返回单词
EN

Stack Overflow用户
提问于 2020-10-27 10:33:06
回答 1查看 766关注 0票数 0

我试图在我的应用程序中使用Google语音到文本API与Python一起实现语音到文本。我得到了正确的转录,但反应只包含成绩单和信心,而不是单独的单词。如果我试图访问这些单词,我会得到一个空列表。

对于访问结果,我使用以下代码:

代码语言:javascript
复制
best_alternative = result.alternatives[0]
word = best_alternative
transcript = best_alternative.transcript
confidence = best_alternative.confidence
print(f'Transcript: {transcript}')
print(f'Confidence: {confidence:.0%}')

打印出来的best_alternative.__dict__给了我成绩单和信心,但没有给我文字。是否有什么特别的方式来访问文字记录或我遗漏了什么?

UPDATE:最初,我初始化识别配置如下:

代码语言:javascript
复制
config = speech.RecognitionConfig(
    encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
    sample_rate_hertz=RATE,
    language_code=lan_code)
streaming_config = speech.StreamingRecognitionConfig(
        config=config,
        interim_results=True,
        enable_speaker_diarization=True)

使用此配置,返回的响应不包含文字、记录和信心。然后,我将配置更改为:

代码语言:javascript
复制
config = speech.RecognitionConfig()
config.sample_rate_hertz = 16000
config.language_code = 'en-US'
config.encoding = speech.RecognitionConfig.AudioEncoding.LINEAR16
config.enable_speaker_diarization = True

这最终给了我文字和成绩单和信心。这些词语可以通过以下方式访问:

代码语言:javascript
复制
response.results[0].alternatives[0].words[i].word
EN

回答 1

Stack Overflow用户

发布于 2020-10-27 13:51:17

根据云语音到文本API REST 文档speech.recognize方法对每个转录结果results[]对象沿SpeechRecognitionResult返回语音识别响应,而SpeechRecognitionAlternative在特定假设中检索transcriptconfidencewords[]

通过Python 谷歌-云-演讲库实现,我承认对于真正的SpeechRecognitionAlternative() 班级,我们可以为每个可识别的单词找到一个特定于单词的信息WordInfo列表。

代码语言:javascript
复制
print("Words: {}".format(result.alternatives[0].words[0].word))
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64552555

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档