问来自wav文件或经过处理的原始音频缓冲区的语音识别
EN

Stack Overflow用户

提问于 2017-11-20 18:25:54

回答 1查看 1.3K关注 0票数 1

我在一个android项目中工作，我需要从语音到文本从音频缓冲区原始数据或从存储的wav文件。在android上可以做到这一点吗？更具体地说，我从这里得到音频缓冲区

record.read(audioBuffer, 0, audioBuffer.length);

我处理音频缓冲区并将其存储为wave文件。我需要将处理后的音频缓冲区转换为文本，或者在音频缓冲区文件保存为wave文件后，我可以使用googles离线语音到文本选项将wav转换为文本。请让我知道我该怎么做。我在这里看到过其他线程，但它们都很老了。(比如4、6、7岁……)

android

speech-to-text

回答 1

Stack Overflow用户

发布于 2017-11-25 23:33:25

我偶然发现了google的can speech API，它可以将原始音频文件作为输入并执行异步语音识别。我有有限的应用程序开发经验和java。https://cloud.google.com/speech/docs/async-recognize这个链接展示了如何和这里是一些加长的源代码https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/speech/cloud-client/src/main/java/com/example/speech/QuickstartSample.java。但问题是，当我在android studio mainactivity.java中将以下导入语句添加到我的应用程序代码中时，它变灰了，一些语句被标记为红色。

import com.google.cloud.speech.v1.RecognitionAudio;
import com.google.cloud.speech.v1.RecognitionConfig;
import com.google.cloud.speech.v1.RecognitionConfig.AudioEncoding;
import com.google.cloud.speech.v1.RecognizeResponse;
import com.google.cloud.speech.v1.SpeechClient;
import com.google.cloud.speech.v1.SpeechRecognitionAlternative;
import com.google.cloud.speech.v1.SpeechRecognitionResult;
import com.google.protobuf.ByteString;

import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.List;

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/47389819

复制

相似问题

问来自wav文件或经过处理的原始音频缓冲区的语音识别
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问来自wav文件或经过处理的原始音频缓冲区的语音识别EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问来自wav文件或经过处理的原始音频缓冲区的语音识别
EN