我在一个android项目中工作,我需要从语音到文本从音频缓冲区原始数据或从存储的wav文件。在android上可以做到这一点吗?更具体地说,我从这里得到音频缓冲区
record.read(audioBuffer, 0, audioBuffer.length);我处理音频缓冲区并将其存储为wave文件。我需要将处理后的音频缓冲区转换为文本,或者在音频缓冲区文件保存为wave文件后,我可以使用googles离线语音到文本选项将wav转换为文本。请让我知道我该怎么做。我在这里看到过其他线程,但它们都很老了。(比如4、6、7岁……)
发布于 2017-11-25 23:33:25
我偶然发现了google的can speech API,它可以将原始音频文件作为输入并执行异步语音识别。我有有限的应用程序开发经验和java。https://cloud.google.com/speech/docs/async-recognize这个链接展示了如何和这里是一些加长的源代码https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/speech/cloud-client/src/main/java/com/example/speech/QuickstartSample.java。但问题是,当我在android studio mainactivity.java中将以下导入语句添加到我的应用程序代码中时,它变灰了,一些语句被标记为红色。
import com.google.cloud.speech.v1.RecognitionAudio;
import com.google.cloud.speech.v1.RecognitionConfig;
import com.google.cloud.speech.v1.RecognitionConfig.AudioEncoding;
import com.google.cloud.speech.v1.RecognizeResponse;
import com.google.cloud.speech.v1.SpeechClient;
import com.google.cloud.speech.v1.SpeechRecognitionAlternative;
import com.google.cloud.speech.v1.SpeechRecognitionResult;
import com.google.protobuf.ByteString;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.List;https://stackoverflow.com/questions/47389819
复制相似问题