首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在使用gcloud工具时,我可以在Google Cloud Speech-to-Text api中指定模型(例如"video")吗?

在使用gcloud工具时,我可以在Google Cloud Speech-to-Text api中指定模型(例如"video")吗?
EN

Stack Overflow用户
提问于 2019-05-20 10:51:34
回答 2查看 213关注 0票数 4

谷歌的语音到文本服务有几种可能的模型可用于将语音转换为文本(标准的、视频的、电话呼叫等)。谷歌在从Python或通过curl向其speech- to -text api发送请求时,提供了使用这些模型的documentation here。但我正在使用gcloud ml speech recognize向该应用程序接口发出请求,并且希望能够指定要使用的模型。我已经阅读了一页又一页的文档来弄清楚这一点,但还没有成功。

我的命令行脚本:

代码语言:javascript
复制
gcloud ml speech recognize test.wav --language-code=EN --useEnhanced=true

我还尝试了--model=video而不是--useEnhanced=true

谷歌的回应是:

代码语言:javascript
复制
ERROR: (gcloud.ml.speech.recognize) unrecognized arguments: --useEnhanced=true

To search the help text of gcloud commands, run:
  gcloud help -- SEARCH_TERMS

请帮帮我!谢谢:)

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-05-27 05:15:03

我不能用gcloud工具让它工作,但我可以用cURL“手动”完成。遵循这里的文档:https://cloud.google.com/speech-to-text/docs/quickstart-protocol。确保创建一个具有适当角色的服务帐户,下载生成的私钥,然后运行export GOOGLE_APPLICATION_CREDENTIALS=path-to-credentials.json。然后根据请求创建一个JSON文件。我的是这样的:

代码语言:javascript
复制
{
    "config": {
        "languageCode": "en-US",
        "useEnhanced": true,
        "model": "video"
    },
    "audio": {
        "uri": "gs://bucket/audio.flac"
    }
  }

然后,只需执行文档为recognize端点建议的cURL命令(注意将文件名更改为您创建的JSON ),就可以了。

下面是recognize端点的文档:https://cloud.google.com/speech-to-text/docs/reference/rest/v1/speech/recognize。您可以单击进入RecognitionConfig和RecognitionAudio对象,查看可以在JSON文件中包含哪些内容。

票数 1
EN

Stack Overflow用户

发布于 2019-05-21 01:23:07

为了指定默认的模型示例"video“,您可以将其作为一个组使用:

代码语言:javascript
复制
gcloud ml video // example

这是与gcloud refence的链接:https://cloud.google.com/sdk/gcloud/reference/ml-engine/#GCLOUD-WIDE-FLAGS

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56213776

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档