腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(364)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
声学
比较库
我需要一个处理音频比较的软件或库,但不使用mp3内部的标记,它应该比较两个音频文件之间的相似性或可信度,或者如果我从音频文件中剪切了一个片段,软件应该指出主音频文件中的文件标记在哪里(希望我足够清楚)。打败了。
浏览 7
修改于2011-02-04
得票数 3
回答已采纳
1
回答
从头创建
声学
模型或调整现有
声学
模型
当采用说话人15分钟语音的
声学
模型时,错误率太高(从6-10个单词中识别出正确的1个单词)。我所做的: 1.我已经将阿拉伯语单词转录成俄语,并将它们放入字典中。2.我已经尝试了ru4sphinx项目的旧模型msu_ru_zero.cd_cont_2000和cmusphinx-ru-5.2的新模型(目前最新的俄语
声学
模型)。或者我需要从头开始为这个1扬声器创建
声学
模型?我根本不需要抄写阿拉伯语,只需要俄语,如果阿拉伯语将默认为一些常见的术语(如-unk-),它也会很好。
浏览 1
修改于2017-01-10
得票数 0
1
回答
声学
回声消除
有没有人知道一个只有一个扬声器的安卓AEC?比方说,我对着我的Android手机说话,它将音频数据流式传输到PC,然后PC通过扬声器立即输出这些数据。所以我会听到我自己的声音。
浏览 8
提问于2013-04-22
得票数 0
回答已采纳
3
回答
页面内
声学
警告
我需要在PHP支持的页面中创建一个声音警告,当PHP中的某些条件得到满足时播放。有没有其他想法可以做到这一点?最好使用jQuery / JS等。
浏览 1
提问于2012-09-05
得票数 3
回答已采纳
1
回答
声学
模型小时数
我知道如何创建语言模型和字典文件,但我仍然停留在
声学
模型上。我记录每个字母的wav文件,但在培训期间,它说培训时间太短,尽管培训仍在继续。当我尝试使用它时,模型不会识别任何东西(给出null)。
浏览 4
提问于2014-10-04
得票数 0
回答已采纳
1
回答
声学
数据的高度图
我有以下问题(还没有代码):我是创建一个4000x256个三角形的缓冲区,分辨率是y轴,还是继续创建一个四边形,然后使用镶嵌来操作数据?
浏览 3
提问于2013-06-28
得票数 1
回答已采纳
1
回答
PocketSphinx python和设置
声学
模型?
我正在阅读上的这份指南,其中提到我需要三个项目来进行语音识别:
声学
模型、语言模型和语音字典。但是我不明白我应该在哪里指定
声学
模型gstreamer有自己的
声学
模型吗?我希望使用这里提供的
声学
模型来获得稍
浏览 0
提问于2012-12-01
得票数 5
回答已采纳
2
回答
语音到文本引擎的
声学
模型训练
训练
声学
模型的步骤是什么?数据(音频)的格式包括其长度和其他特征。如果有人能提供一个简单的例子,如何训练一个
声学
模型,这将是非常感谢。
浏览 0
修改于2019-04-04
得票数 0
回答已采纳
1
回答
在sphinx-4上使用HTK
声学
模型
我有一个用HTK开发的阿拉伯
声学
模型。我想知道如何在Sphinx-4中使用这个
声学
模型。
浏览 4
提问于2012-06-13
得票数 0
回答已采纳
3
回答
WebRTC
声学
回声消除
我目前在webrtc项目中工作,在不使用耳机或外部麦克风时遇到音频回声问题,有什么解决方法或修复方法吗
浏览 16
提问于2016-05-23
得票数 6
回答已采纳
1
回答
CMUSphinx训练
声学
模型精度很低
我按照tutorial 为我的越南语训练了一个新的
声学
模型。简单地说,我记录了从0到9的数字来进行训练,并使用这些经过训练的数据进行测试。因此,准确率应该是预期的100%。
浏览 5
提问于2019-05-15
得票数 1
1
回答
如何在
声学
数据集上应用数据增强?
我有一个关于人类声音的小型
声学
数据集,我想对其进行扩充,然后将其传递给二进制分类器。 我熟悉图像的数据增强,但它是如何为
声学
数据集做的?
浏览 2
提问于2020-03-24
得票数 0
1
回答
什么是上下文相关的
声学
建模?
我试图弄清楚什么是上下文依赖/依赖
声学
建模。我一直在试着阅读一些关于它的报纸,但是我对这个概念仍然有些动摇。正如我目前所理解的(这可能是错误的),上下文相关的
声学
模型是根据在序列中发生音素的数据进行训练的
声学
模型。例如,用单词对目标语言进行训练,因此音素是由前后发生的音素所决定的,给出了上下文。而独立的语境将是一个
声学
模型,有些是如何与音素隔离地训练的。
浏览 10
提问于2016-05-22
得票数 2
回答已采纳
1
回答
失踪
声学
模型定义(mdef)与pocketsphinx
我最近在Lubuntu15.10上安装了pocketsphinx-python,并希望在音频文件(最好是8kH)上进行语音识别。虽然我不明白,但我收到了一条错误消息,因为我的文件夹/usr/share/pocketsphinx/model/hmm/en_US/中有一个名为/usr/share/pocketsphinx/model/hmm/en_US/的文件,它说我没有: INFO: feat.c(715): Initializing feature stream to type: '1s_c_d_dd', ceplen=13, CMN='current', VA
浏览 7
提问于2016-03-03
得票数 3
回答已采纳
2
回答
如何预处理
声学
数据
我想知道是否有任何经验法则来预处理
声学
数据。直接使用原始数据(时间信号)还是先构造光谱图,然后使用这些数据更好? 有纸,说生更好,也有文件说光谱更好。
浏览 0
修改于2017-08-31
得票数 2
回答已采纳
1
回答
试图使用法国的
声学
模型
我正在尝试使用OpenEars的法国
声学
模型。非常有趣。但是我已经下载了法国的
声学
模型我不知道如何使用它..。
浏览 5
修改于2017-05-23
得票数 0
回答已采纳
1
回答
训练
声学
模型需要多长时间?
我想在中国为14岁以下的儿童建立一个英语
声学
模型,使用cmusphinx,词汇量约800个单词。我做了一些研究,一些商业语音引擎需要花费数千个小时的语音记录来训练他们的
声学
模型:(细微差别和谷歌花费了2000+和1000+时间)。
浏览 3
修改于2013-10-31
得票数 0
回答已采纳
1
回答
声学
模型兼容性问题
我使用这个版本附带的
声学
模型和字典。出于某些原因,我想在旧的sphinx-4版本中使用相同的AM和
声学
模型,但我得到了: java.lang.IndexOutOfBoundsException: Index: 13824, Size: 13824
浏览 14
修改于2016-09-01
得票数 0
回答已采纳
1
回答
创建用于房间
声学
模拟的AR
我想做一个关于房间
声学
模拟的项目,我以前一直痴迷于如何绘制线条。
浏览 0
提问于2018-07-05
得票数 0
2
回答
声学
指纹的原理是什么?
什么样的API或框架被用来分配一个音符的一个值?比如,像Shazzam这样的应用程序如何从麦克风中获取信息,并知道该如何处理它?对我来说,这是惊人的电话,麦克风和一些巧妙的逻辑可以竞争调谐器从一个音乐商店!关于这个主题的有趣的论文。音乐识别应用软件Shazzam基于和的原理
浏览 8
修改于2017-01-12
得票数 1
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券