目前,Watson的speech-to-text API似乎希望应用程序接口调用将音频上传到Watson服务器。在音频已经存在于云中(例如,在S3上)的情况下,这需要用户下载文件,然后将其重新上传到Watson。
有没有办法在API调用中包含媒体文件的URL?
发布于 2016-04-25 03:05:12
API需要音频,但目前不支持URL文件。
这取决于开发人员下载音频(在您的示例中是从S3)并将其上传到API。
下面的示例从Dropbox获取ogg文件,并将其发送到Speech to Text进行识别。
var watson = require('watson-developer-cloud');
var request = require('request');
var fs = require('fs');
var speechToText = watson.speech_to_text({
username: 'SERVICE USERNAME',
password: 'SERVICE PASSWORD',
version: 'v1',
url: 'https://stream.watsonplatform.net/speech-to-text/api'
});
var audioFile = 'https://www.dropbox.com/s/l97pe3x996fnbtg/speech.ogg?dl=1';
// create the stream
var recognizeStream = speechToText.createRecognizeStream();
// pipe in some audio
request(audioFile).pipe(recognizeStream);
// and pipe out the transcription
recognizeStream.pipe(fs.createWriteStream('transcription.txt'));https://stackoverflow.com/questions/36654786
复制相似问题