嗨,我的要求是,我有实时音频流作为输入,说两个人之间的一个电话,现在转换该音频为文本在现场和选择某些关键字从提取的文本和插入数据库。
按照https://github.com/aws-samples/amazon-connect-realtime-transcription中的体系结构,服务和AWS转录服务都用于实时流,但是作为链接:https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-now-supports-real-time-transcriptions/ AWS转录支持实时转录,那么为什么在该体系结构中使用Kinesis呢?
如果有人知道,请帮助我在理解,希望亚马逊连接可以摄取实时音频到AWS转录为现场转录。
发布于 2019-03-15 18:27:25
Amazon视频流是一种支持来自Amazon的流式语音数据的服务。亚马逊转录可以摄取任何来源的流进行实时转录,但从Amazon获取实时数据的唯一方法是通过Kinesis。实时流启动公告可能有助于更清楚地说明这一点:
有了客户语音流功能,您的客户音频将自动发送到Amazon视频流,在那里可以通过您允许的集成来访问它。例如,您可以将客户语音流与实时文本转录和情感分析集成起来,以便对呼叫质量进行即时反馈,或者使用此功能与第三方语音生物识别产品一起自动验证来电者,而无需输入密码或确认个人信息。
https://stackoverflow.com/questions/55188353
复制相似问题