我在试着把我的扬声器的声音录下来
我正在把声音从扬声器传到node.js文件(https://askubuntu.com/a/850174)
parec -d alsa_output.pci-0000_00_1b.0.analog-stereo.monitor --rate=16000 --channels=1 | node transcribe.js这是我的transcribe.js
const speech = require('@google-cloud/speech');
const client = new speech.SpeechClient();
const encoding = 'LINEAR16';
const sampleRateHertz = 16000;
const languageCode = 'en-US';
const request = {
config: {
encoding: encoding,
sampleRateHertz: sampleRateHertz,
languageCode: languageCode,
},
interimResults: false, // If you want interim results, set this to true
};
const recognizeStream = client
.streamingRecognize(request)
.on('error', console.error)
.on('data', data => {
console.log(
`Transcription: ${data.results[0].alternatives[0].transcript}`
);
});
process.stdin.pipe(recognizeStream);但是Google语音到文本在1分钟内对流媒体识别有一个限制。因此,我有错误“超过了最大允许的流持续时间65秒。
我怎样才能把溪流分割成块,用沉默来分割,或者用30秒的时间分割成块?
发布于 2019-01-31 15:45:30
我们可以将音频传输到sox实用程序中,以便以0.3s的持续时间和不超过55s的沉默来分割它。
sox -t raw -r 16k -e signed -b 16 -c 1 - ./chunks/output.wav silence 1 0.3 0.1% 1 0.3 0.1% trim 0 55 : newfile : restart现在,我们可以查看新文件块dir,并将其流到Google Cloud语音到文本API。
https://stackoverflow.com/questions/54454383
复制相似问题