我试图编写一个节点应用程序,通过AWS的流转录服务从麦克风转录音频。到目前为止,我可以在这个储存库中找到它(它很小)。
不幸的是,上面的方法不起作用。我相信,在把麦克风流提供的数据传递到可写的转录流之前,并将其转换成可写的转录流是有缺陷的。这是因为我已经证明了应用程序的另外两个组件可以工作。
顺便提一句,我不熟悉处理音频数据和编码(解码?)寄给PCM。如果麦克风流给我的是PCM,如果我需要在提供给转录服务之前从PCM解码或编码到PCM,我甚至不确定。所有这些都是为了说,我很确定字节处理是问题所在。
任何帮助理顺这一点将是非常感谢的。
谢谢,杰夫
发布于 2020-06-04 15:20:35
发送给亚马逊转录流的数据帧需要在特定的这里中进行编码。
由于您使用的是WebSocket流,所以JavaScript中有一个示例项目,您可以参考/使用:https://github.com/aws-samples/amazon-transcribe-websocket-static
https://stackoverflow.com/questions/62186447
复制相似问题