搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

2回答

声学比较库

我需要一个处理音频比较的软件或库，但不使用mp3内部的标记，它应该比较两个音频文件之间的相似性或可信度，或者如果我从音频文件中剪切了一个片段，软件应该指出主音频文件中的文件标记在哪里(希望我足够清楚)。打败了。

浏览 7修改于2011-02-04得票数 3

回答已采纳

1回答

当采用说话人15分钟语音的声学模型时，错误率太高(从6-10个单词中识别出正确的1个单词)。我所做的: 1.我已经将阿拉伯语单词转录成俄语，并将它们放入字典中。2.我已经尝试了ru4sphinx项目的旧模型msu_ru_zero.cd_cont_2000和cmusphinx-ru-5.2的新模型(目前最新的俄语声学模型)。或者我需要从头开始为这个1扬声器创建声学模型？我根本不需要抄写阿拉伯语，只需要俄语，如果阿拉伯语将默认为一些常见的术语(如-unk-)，它也会很好。

浏览 1修改于2017-01-10得票数 0

1回答

声学回声消除

有没有人知道一个只有一个扬声器的安卓AEC？比方说，我对着我的Android手机说话，它将音频数据流式传输到PC，然后PC通过扬声器立即输出这些数据。所以我会听到我自己的声音。

浏览 8提问于2013-04-22得票数 0

回答已采纳

3回答

页面内声学警告

我需要在PHP支持的页面中创建一个声音警告，当PHP中的某些条件得到满足时播放。有没有其他想法可以做到这一点？最好使用jQuery / JS等。

浏览 1提问于2012-09-05得票数 3

回答已采纳

1回答

声学模型小时数

我知道如何创建语言模型和字典文件，但我仍然停留在声学模型上。我记录每个字母的wav文件，但在培训期间，它说培训时间太短，尽管培训仍在继续。当我尝试使用它时，模型不会识别任何东西(给出null)。

浏览 4提问于2014-10-04得票数 0

回答已采纳

1回答

声学数据的高度图

我有以下问题(还没有代码)：我是创建一个4000x256个三角形的缓冲区，分辨率是y轴，还是继续创建一个四边形，然后使用镶嵌来操作数据？

浏览 3提问于2013-06-28得票数 1

回答已采纳

1回答

PocketSphinx python和设置声学模型？

我正在阅读上的这份指南，其中提到我需要三个项目来进行语音识别:声学模型、语言模型和语音字典。但是我不明白我应该在哪里指定声学模型gstreamer有自己的声学模型吗？我希望使用这里提供的声学模型来获得稍

浏览 0提问于2012-12-01得票数 5

回答已采纳

3回答

WebRTC声学回声消除

我目前在webrtc项目中工作，在不使用耳机或外部麦克风时遇到音频回声问题，有什么解决方法或修复方法吗

浏览 16提问于2016-05-23得票数 6

回答已采纳

2回答

语音到文本引擎的声学模型训练

训练声学模型的步骤是什么？数据(音频)的格式包括其长度和其他特征。如果有人能提供一个简单的例子，如何训练一个声学模型，这将是非常感谢。

浏览 0修改于2019-04-04得票数 0

回答已采纳

1回答

在sphinx-4上使用HTK声学模型

我有一个用HTK开发的阿拉伯声学模型。我想知道如何在Sphinx-4中使用这个声学模型。

浏览 4提问于2012-06-13得票数 0

回答已采纳

1回答

CMUSphinx训练声学模型精度很低

我按照tutorial 为我的越南语训练了一个新的声学模型。简单地说，我记录了从0到9的数字来进行训练，并使用这些经过训练的数据进行测试。因此，准确率应该是预期的100%。

浏览 5提问于2019-05-15得票数 1

1回答

什么是上下文相关的声学建模？

我试图弄清楚什么是上下文依赖/依赖声学建模。我一直在试着阅读一些关于它的报纸，但是我对这个概念仍然有些动摇。正如我目前所理解的(这可能是错误的)，上下文相关的声学模型是根据在序列中发生音素的数据进行训练的声学模型。例如，用单词对目标语言进行训练，因此音素是由前后发生的音素所决定的，给出了上下文。而独立的语境将是一个声学模型，有些是如何与音素隔离地训练的。

浏览 10提问于2016-05-22得票数 2

回答已采纳

1回答

失踪声学模型定义(mdef)与pocketsphinx

我最近在Lubuntu15.10上安装了pocketsphinx-python，并希望在音频文件(最好是8kH)上进行语音识别。虽然我不明白，但我收到了一条错误消息，因为我的文件夹/usr/share/pocketsphinx/model/hmm/en_US/中有一个名为/usr/share/pocketsphinx/model/hmm/en_US/的文件，它说我没有： INFO: feat.c(715): Initializing feature stream to type: '1s_c_d_dd', ceplen=13, CMN='current', VA

浏览 7提问于2016-03-03得票数 3

回答已采纳

2回答

如何预处理声学数据

我想知道是否有任何经验法则来预处理声学数据。直接使用原始数据(时间信号)还是先构造光谱图，然后使用这些数据更好？有纸，说生更好，也有文件说光谱更好。

浏览 0修改于2017-08-31得票数 2

回答已采纳

1回答

如何在声学数据集上应用数据增强？

我有一个关于人类声音的小型声学数据集，我想对其进行扩充，然后将其传递给二进制分类器。我熟悉图像的数据增强，但它是如何为声学数据集做的？

浏览 2提问于2020-03-24得票数 0

1回答

训练声学模型需要多长时间？

我想在中国为14岁以下的儿童建立一个英语声学模型，使用cmusphinx，词汇量约800个单词。我做了一些研究，一些商业语音引擎需要花费数千个小时的语音记录来训练他们的声学模型：(细微差别和谷歌花费了2000+和1000+时间)。

浏览 3修改于2013-10-31得票数 0

回答已采纳

1回答

试图使用法国的声学模型

我正在尝试使用OpenEars的法国声学模型。非常有趣。但是我已经下载了法国的声学模型我不知道如何使用它..。

浏览 5修改于2017-05-23得票数 0

回答已采纳

1回答

声学模型兼容性问题

我使用这个版本附带的声学模型和字典。出于某些原因，我想在旧的sphinx-4版本中使用相同的AM和声学模型，但我得到了： java.lang.IndexOutOfBoundsException: Index: 13824, Size: 13824

浏览 14修改于2016-09-01得票数 0

回答已采纳

1回答

创建用于房间声学模拟的AR

我想做一个关于房间声学模拟的项目，我以前一直痴迷于如何绘制线条。

浏览 0提问于2018-07-05得票数 0

2回答

声学指纹的原理是什么？

什么样的API或框架被用来分配一个音符的一个值？比如，像Shazzam这样的应用程序如何从麦克风中获取信息，并知道该如何处理它？对我来说，这是惊人的电话，麦克风和一些巧妙的逻辑可以竞争调谐器从一个音乐商店！关于这个主题的有趣的论文。音乐识别应用软件Shazzam基于和的原理

浏览 8修改于2017-01-12得票数 1

回答已采纳

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

声学比较库

从头创建声学模型或调整现有声学模型

声学回声消除

页面内声学警告

声学模型小时数

声学数据的高度图

PocketSphinx python和设置声学模型？

WebRTC声学回声消除

语音到文本引擎的声学模型训练

在sphinx-4上使用HTK声学模型

CMUSphinx训练声学模型精度很低

什么是上下文相关的声学建模？

失踪声学模型定义(mdef)与pocketsphinx

如何预处理声学数据

如何在声学数据集上应用数据增强？

训练声学模型需要多长时间？

试图使用法国的声学模型

声学模型兼容性问题

创建用于房间声学模拟的AR

声学指纹的原理是什么？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐