首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用来翻译实时流?

如何使用来翻译实时流?
EN

Stack Overflow用户
提问于 2017-05-25 09:30:15
回答 1查看 5.2K关注 0票数 12

这是Google语音API文档:https://cloud.google.com/speech/docs/sync-recognize

我试了两个星期这个API,但仍然不能解决我的主要目的(翻译现场流媒体)。

我正在使用PHP。(允许其他语言建议,我会自己找到的)

我在两周内能做的是:

  1. 同步语音识别(<=1min)
  2. 异步语音识别(>1 1min和<=80min)。备注:我可以修改这个以接受3小时的视频。
  3. 麦克风的实时语音识别:https://www.google.com/intl/en/chrome/demos/speech.html
  4. 更新:在音频持续时间小于6秒的情况下执行流API。

我不能做的是:

  1. 如何翻译现场直播。例:无线流媒体(允许延迟)
  2. 视频/音频播放时如何翻译。(允许延迟)

更新:

我也在github上问这个问题。但既然没有人回答,我就问这里

摘要:

我可以执行语音流,但只有6秒的音频。这与我所期望的不一样。我的期望是认识到无限的持续时间(似乎我们不知道什么时候广播流将结束)。

谢谢你的帮助。我非常感激

更新:

以批准我不能使用超过6秒的视频。所以我写了这个:

我尝试这个视频interview.mp4并使用这个ffmpeg -i interview.mp4 -c:a flac -ar 16000 -ac 1 -sample_fmt s16 interview.flac将它与ffmpeg转换为interview.flac

我使用这个图书馆来转录视频,使用以下命令:

php speech.php transcribe --encoding FLAC --language-code en-US --sample-rate 16000 --stream interview.flac

结果是:

代码语言:javascript
复制
  [Google\GAX\ApiException]
  Invalid 'audio_content': too long.

它不会太长,因为视频的持续时间只有48秒。这是ffmpeg结果的元数据:

代码语言:javascript
复制
Output #0, flac, to 'interview.flac':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf57.72.101
    Stream #0:0(und): Audio: flac, 16000 Hz, mono, s16, 128 kb/s (default)
    Metadata:
      handler_name    : SoundHandler
      encoder         : Lavc57.92.100 flac
size=     810kB time=00:00:48.01 bitrate= 138.1kbits/s speed= 108x
video:0kB audio:801kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 1.019650%
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-05-25 13:22:11

您需要使用API调用。您可以在PHP中找到这样做的示例。

票数 9
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44177012

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档