首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >来自wav文件或经过处理的原始音频缓冲区的语音识别

来自wav文件或经过处理的原始音频缓冲区的语音识别
EN

Stack Overflow用户
提问于 2017-11-20 18:25:54
回答 1查看 1.3K关注 0票数 1

我在一个android项目中工作,我需要从语音到文本从音频缓冲区原始数据或从存储的wav文件。在android上可以做到这一点吗?更具体地说,我从这里得到音频缓冲区

代码语言:javascript
复制
record.read(audioBuffer, 0, audioBuffer.length);

我处理音频缓冲区并将其存储为wave文件。我需要将处理后的音频缓冲区转换为文本,或者在音频缓冲区文件保存为wave文件后,我可以使用googles离线语音到文本选项将wav转换为文本。请让我知道我该怎么做。我在这里看到过其他线程,但它们都很老了。(比如4、6、7岁……)

EN

回答 1

Stack Overflow用户

发布于 2017-11-25 23:33:25

我偶然发现了google的can speech API,它可以将原始音频文件作为输入并执行异步语音识别。我有有限的应用程序开发经验和java。https://cloud.google.com/speech/docs/async-recognize这个链接展示了如何和这里是一些加长的源代码https://github.com/GoogleCloudPlatform/java-docs-samples/blob/master/speech/cloud-client/src/main/java/com/example/speech/QuickstartSample.java。但问题是,当我在android studio mainactivity.java中将以下导入语句添加到我的应用程序代码中时,它变灰了,一些语句被标记为红色。

代码语言:javascript
复制
import com.google.cloud.speech.v1.RecognitionAudio;
import com.google.cloud.speech.v1.RecognitionConfig;
import com.google.cloud.speech.v1.RecognitionConfig.AudioEncoding;
import com.google.cloud.speech.v1.RecognizeResponse;
import com.google.cloud.speech.v1.SpeechClient;
import com.google.cloud.speech.v1.SpeechRecognitionAlternative;
import com.google.cloud.speech.v1.SpeechRecognitionResult;
import com.google.protobuf.ByteString;

import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.List;
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47389819

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档