腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
3
回答
检测
音频
流中的
特征
我想编写/编程/开发一种算法,它可以识别/麦克风
音频
线路中数据中的许多
特征
。
音频
流将是音乐,我想过滤掉
特征
来区分歌曲,通过区分,我的意思是你可以区分歌曲的流派。例如,我想知道这首歌是不是在
3
/4的时间段。FFT是从
音频
流中获得不同
特征
的一个很好的开始,但我不知道从哪里开始。FFT是否足以获得
音频
流的良好
特征
,或者是
浏览 1
修改于2013-04-20
得票数 5
2
回答
如何在java中提取
音频
特征
?
我的论文项目是
音频
特征
提取,它们的分类和比较。我只是有个可能行得通的主意。任何格式的
音频
都可以转换为pcm格式,并可以从中提取带宽、零交叉率、噪声帧比、基音强度和mel频率谱系数等
特征
。然后使用这些
特征
准备数据集,然后对其应用各种
音频
分类算法。请帮助我如何才能进一步提取
音频
特征
? 谢谢
浏览 0
提问于2011-02-02
得票数 4
1
回答
如何使用Accord.net C#提取
音频
特征
我想在C#中提取输入
音频
文件的特性。(频率、长度等) 为此,我尝试使用Accord.audio nuget库。但我没有找到一个适合我需要的如何指导或工作的例子。您能告诉我如何使用accord.audio nuget库提取文件的
音频
特征
吗?作为一个例子,当我输入"song.mp
3
“文件时,我想要一个频率数组、分贝数组、长度等"song.mp
3
”
特征
。
浏览 0
提问于2019-05-05
得票数 2
回答已采纳
1
回答
基于受限boltzmann机器的
音频
特征
提取
我想使用RBM (受限玻尔兹曼机)提取
音频
特征
。为此,我给出了频谱图(PCA白化)作为RBM的输入。“然后,我们训练了300个第一层基础,过滤器长度为6,最大池比率为<
浏览 1
提问于2013-12-13
得票数 2
1
回答
用于机器学习/Logistic回归的三维矩阵
我正在做一个涉及
音频
的项目,其中对于矩阵X,n维是每个
音频
样本的
特征
,m维是我相互比较的
音频
文件的数量。我面临的问题是,对于每个
音频
文件,都有大量的
音频
样本(每44100个样本,我将其作为"1个样本“),每个样本包括每个不同的
特征
。我不是简单地取每个
音频
样本的每个
特征
的平均值,而是考虑如上所述向矩阵中添加第三个维度,即
音频
样本。问题是,我不知道这在逻辑回归中如何成立/我可以期望我的输出变量y是什么
浏览 0
提问于2018-12-23
得票数 0
1
回答
使用tarosdsp提取多个
音频
特征
我正在使用tarosdsp从
音频
中提取
特征
。我已经能够提取mfcc
特征
。为了提取其他
特征
,如过零率,音高,我需要定义新的
音频
调度器,还是应该使用相同的调度器并添加
音频
处理器。举个例子会有所帮助。final List<float[]>mfccList = new ArrayList<>(200); A
浏览 12
提问于2019-04-05
得票数 0
1
回答
如何使用Swift在iOS中将
音频
mp
3
文件转换为
音频
类型raw?
在iOS中使用Swift将
音频
mp
3
文件转换为具有以下
特征
的
音频
类型raw的最有效方法是什么?
浏览 2
提问于2020-02-09
得票数 4
1
回答
在google的
音频
集中,使用什么算法进行
音频
特征
提取?
虽然数据集是广泛的,但我发现有关
音频
特征
提取的信息非常模糊。网站提到 在中,作者讨论了在960毫秒块上使用mel谱图来获得96x64表示。
浏览 5
提问于2017-05-19
得票数 1
回答已采纳
1
回答
如何有效地组合多个
特征
向量进行分类
我有4个numpy数组(
特征
)。numpy数组的维数为:a2=(360,100)a4=(360,13) 我有360 (4类,每个是90)
音频
文件。我从这些wav文件中获得了4个不同的
特征
(a1,..a4)。我分别尝试了这些
特征
(a1,..a4)来训练svm并对
音频
进行分类。但有些结果并不好。现在我想将这4个
特征
结合起来,以获得更好的结果。我只想确定这些
特征
的一些系数,并只获得一个用于分类的
浏览 0
修改于2017-10-07
得票数 1
1
回答
异源
特征
的
特征
联合
我有三个不同的功能集,为给定的一组
音频
文件。它们中的每一个都是作为维数组存储的
特征
矩阵,如下所示: 使用不同的技术从
音频
文件中提取这些
特征
中的每一个
浏览 0
修改于2017-05-23
得票数 5
1
回答
基于MFCC的
特征
提取
我想知道,如何提取
音频
(x.wav)信号,用MFCC进行
特征
提取?我知道使用MFCC提取
音频
特征
的步骤。我想知道使用Django框架在Python中进行的详细编码
浏览 66
修改于2019-05-12
得票数 2
回答已采纳
3
回答
使用OpenSMILE从实时输入中提取
音频
特征
我可以使用OpenSMILE从存储在系统中的
音频
文件中提取
特征
。但我需要使用相同的OpenSMILE实时提取
特征
。有没有可能不保存录制的
音频
文件?
浏览 6
修改于2014-07-17
得票数 1
2
回答
中餐过程可能与距离相关
我是机器学习的新手,我想在MATLAB中实现与距离相关的中餐厅过程,用于
音频
轨迹的聚类。 我将运行该算法,例如,16声道。
音频
输入算法的方
浏览 0
修改于2013-11-12
得票数 1
3
回答
如何使用两个
特征
向量来训练向量机?
numpy数组的尺寸如下:Image=(360,5)->
特征
是从这些
音频
文件的谱图中提取出来的。我还试图将这两个数组连接起来,但尺寸不同。我怎样才能解决这个问题?
浏览 1
提问于2017-09-15
得票数 3
回答已采纳
2
回答
最能描述音乐的
音频
功能是什么?
我正在为
音频
流项目设计推荐系统的基于内容的过滤部分。为了你的答案。编辑: 音乐节奏持续时间光谱滚转光谱带宽我想知道这些
音频
特征
在多大程度上与“描述”
音频
摘录有关。
浏览 0
修改于2019-04-25
得票数 2
2
回答
两个
音频
序列之间的感知相似性
我想测量两段
音频
之间的距离。例如,我想将动物的声音与人类模仿动物的声音进行比较,然后返回声音相似程度的分数。 这似乎是一个很难的问题。什么是处理它的最好方法?我在考虑从
音频
信号中提取几个
特征
,然后对这些
特征
进行欧几里得距离或余弦相似度(或类似的东西)。什么样的
特征
容易提取并有助于确定声音之间的感知差异?(我在某个地方看到Shazam使用散列,但这是一个不同的问题,因为被比较的两段
音频
基本上是相同的,但其中一段有更多噪音。在这里,这两段
音频
并不相同,它们只是在感知上相似。
浏览 9
修改于2020-07-03
得票数 18
2
回答
基于FFT、PSD和STFT的
音频
特征
提取及最强频率提取
如何将这些系数用作
音频
特征
?(这里使用的是模式识别意义上的
音频
特征
)。p = psd(Hs, x, 'Fs', 22050);max_f = p.Frequencies(I);
3
)
浏览 4
提问于2013-01-21
得票数 2
1
回答
将多元高斯分布拟合到给定的数据集
我需要拟合多变量高斯分布,即获得python中给定
音频
特征
数据集的最接近多变量高斯的均值向量和协方差矩阵。
音频
特征
(MFCC系数)是N×13矩阵,其中N约为4K。
浏览 6
提问于2014-12-01
得票数 13
3
回答
从
音频
文件中提取数据有哪些好的库?
作为一个宠物项目,我喜欢制作我自己的歌曲指纹应用程序,这样我就可以获得一些
音频
编程的经验。另请参阅:
浏览 3
修改于2009-08-16
得票数 3
1
回答
wavenet的输入是什么?
原始论文,解释了为局部条件作用添加时间序列,解释说,为局部条件作用添加mel频谱图
特征
是很好的。如我们所知,Wavenet是一种生成模型,并且在经过调节时采用原始
音频
输入来生成高
音频
输出,请帮帮忙,这是非常需要的。 谢谢
浏览 1
提问于2019-12-09
得票数 3
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券