搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

3回答

检测音频流中的特征

我想编写/编程/开发一种算法，它可以识别/麦克风音频线路中数据中的许多特征。音频流将是音乐，我想过滤掉特征来区分歌曲，通过区分，我的意思是你可以区分歌曲的流派。例如，我想知道这首歌是不是在3/4的时间段。FFT是从音频流中获得不同特征的一个很好的开始，但我不知道从哪里开始。FFT是否足以获得音频流的良好特征，或者是

浏览 1修改于2013-04-20得票数 5

2回答

如何在java中提取音频特征？

我的论文项目是音频特征提取，它们的分类和比较。我只是有个可能行得通的主意。任何格式的音频都可以转换为pcm格式，并可以从中提取带宽、零交叉率、噪声帧比、基音强度和mel频率谱系数等特征。然后使用这些特征准备数据集，然后对其应用各种音频分类算法。请帮助我如何才能进一步提取音频特征？谢谢

浏览 0提问于2011-02-02得票数 4

1回答

如何使用Accord.net C#提取音频特征

我想在C#中提取输入音频文件的特性。(频率、长度等) 为此，我尝试使用Accord.audio nuget库。但我没有找到一个适合我需要的如何指导或工作的例子。您能告诉我如何使用accord.audio nuget库提取文件的音频特征吗？作为一个例子，当我输入"song.mp3“文件时，我想要一个频率数组、分贝数组、长度等"song.mp3”特征。

浏览 0提问于2019-05-05得票数 2

回答已采纳

1回答

基于受限boltzmann机器的音频特征提取

我想使用RBM (受限玻尔兹曼机)提取音频特征。为此，我给出了频谱图(PCA白化)作为RBM的输入。“然后，我们训练了300个第一层基础，过滤器长度为6，最大池比率为<

浏览 1提问于2013-12-13得票数 2

1回答

我正在做一个涉及音频的项目，其中对于矩阵X，n维是每个音频样本的特征，m维是我相互比较的音频文件的数量。我面临的问题是，对于每个音频文件，都有大量的音频样本(每44100个样本，我将其作为"1个样本“)，每个样本包括每个不同的特征。我不是简单地取每个音频样本的每个特征的平均值，而是考虑如上所述向矩阵中添加第三个维度，即音频样本。问题是，我不知道这在逻辑回归中如何成立/我可以期望我的输出变量y是什么

浏览 0提问于2018-12-23得票数 0

1回答

使用tarosdsp提取多个音频特征

我正在使用tarosdsp从音频中提取特征。我已经能够提取mfcc特征。为了提取其他特征，如过零率，音高，我需要定义新的音频调度器，还是应该使用相同的调度器并添加音频处理器。举个例子会有所帮助。final List<float[]>mfccList = new ArrayList<>(200); A

浏览 12提问于2019-04-05得票数 0

1回答

如何使用Swift在iOS中将音频mp3文件转换为音频类型raw？

在iOS中使用Swift将音频mp3文件转换为具有以下特征的音频类型raw的最有效方法是什么？

浏览 2提问于2020-02-09得票数 4

1回答

在google的音频集中，使用什么算法进行音频特征提取？

虽然数据集是广泛的，但我发现有关音频特征提取的信息非常模糊。网站提到在中，作者讨论了在960毫秒块上使用mel谱图来获得96x64表示。

浏览 5提问于2017-05-19得票数 1

回答已采纳

1回答

如何有效地组合多个特征向量进行分类

我有4个numpy数组(特征)。numpy数组的维数为：a2=(360,100)a4=(360,13) 我有360 (4类，每个是90)音频文件。我从这些wav文件中获得了4个不同的特征(a1，..a4)。我分别尝试了这些特征(a1，..a4)来训练svm并对音频进行分类。但有些结果并不好。现在我想将这4个特征结合起来，以获得更好的结果。我只想确定这些特征的一些系数，并只获得一个用于分类的

浏览 0修改于2017-10-07得票数 1

1回答

异源特征的特征联合

我有三个不同的功能集，为给定的一组音频文件。它们中的每一个都是作为维数组存储的特征矩阵，如下所示：使用不同的技术从音频文件中提取这些特征中的每一个

浏览 0修改于2017-05-23得票数 5

1回答

基于MFCC的特征提取

我想知道，如何提取音频(x.wav)信号，用MFCC进行特征提取？我知道使用MFCC提取音频特征的步骤。我想知道使用Django框架在Python中进行的详细编码

浏览 66修改于2019-05-12得票数 2

回答已采纳

3回答

使用OpenSMILE从实时输入中提取音频特征

我可以使用OpenSMILE从存储在系统中的音频文件中提取特征。但我需要使用相同的OpenSMILE实时提取特征。有没有可能不保存录制的音频文件？

浏览 6修改于2014-07-17得票数 1

2回答

中餐过程可能与距离相关

我是机器学习的新手，我想在MATLAB中实现与距离相关的中餐厅过程，用于音频轨迹的聚类。我将运行该算法，例如，16声道。音频输入算法的方

浏览 0修改于2013-11-12得票数 1

3回答

如何使用两个特征向量来训练向量机？

numpy数组的尺寸如下：Image=(360，5)->特征是从这些音频文件的谱图中提取出来的。我还试图将这两个数组连接起来，但尺寸不同。我怎样才能解决这个问题？

浏览 1提问于2017-09-15得票数 3

回答已采纳

2回答

最能描述音乐的音频功能是什么？

我正在为音频流项目设计推荐系统的基于内容的过滤部分。为了你的答案。编辑：音乐节奏持续时间光谱滚转光谱带宽我想知道这些音频特征在多大程度上与“描述”音频摘录有关。

浏览 0修改于2019-04-25得票数 2

2回答

两个音频序列之间的感知相似性

我想测量两段音频之间的距离。例如，我想将动物的声音与人类模仿动物的声音进行比较，然后返回声音相似程度的分数。这似乎是一个很难的问题。什么是处理它的最好方法？我在考虑从音频信号中提取几个特征，然后对这些特征进行欧几里得距离或余弦相似度(或类似的东西)。什么样的特征容易提取并有助于确定声音之间的感知差异？(我在某个地方看到Shazam使用散列，但这是一个不同的问题，因为被比较的两段音频基本上是相同的，但其中一段有更多噪音。在这里，这两段音频并不相同，它们只是在感知上相似。

浏览 9修改于2020-07-03得票数 18

2回答

基于FFT、PSD和STFT的音频特征提取及最强频率提取

如何将这些系数用作音频特征？(这里使用的是模式识别意义上的音频特征)。p = psd(Hs, x, 'Fs', 22050);max_f = p.Frequencies(I); 3)

浏览 4提问于2013-01-21得票数 2

1回答

将多元高斯分布拟合到给定的数据集

我需要拟合多变量高斯分布，即获得python中给定音频特征数据集的最接近多变量高斯的均值向量和协方差矩阵。音频特征(MFCC系数)是N×13矩阵，其中N约为4K。

浏览 6提问于2014-12-01得票数 13

3回答

从音频文件中提取数据有哪些好的库？

作为一个宠物项目，我喜欢制作我自己的歌曲指纹应用程序，这样我就可以获得一些音频编程的经验。另请参阅：

浏览 3修改于2009-08-16得票数 3

1回答

wavenet的输入是什么？

原始论文，解释了为局部条件作用添加时间序列，解释说，为局部条件作用添加mel频谱图特征是很好的。如我们所知，Wavenet是一种生成模型，并且在经过调节时采用原始音频输入来生成高音频输出，请帮帮忙，这是非常需要的。谢谢

浏览 1提问于2019-12-09得票数 3

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

检测音频流中的特征

如何在java中提取音频特征？

如何使用Accord.net C#提取音频特征

基于受限boltzmann机器的音频特征提取

用于机器学习/Logistic回归的三维矩阵

使用tarosdsp提取多个音频特征

如何使用Swift在iOS中将音频mp3文件转换为音频类型raw？

在google的音频集中，使用什么算法进行音频特征提取？

如何有效地组合多个特征向量进行分类

异源特征的特征联合

基于MFCC的特征提取

使用OpenSMILE从实时输入中提取音频特征

中餐过程可能与距离相关

如何使用两个特征向量来训练向量机？

最能描述音乐的音频功能是什么？

两个音频序列之间的感知相似性

基于FFT、PSD和STFT的音频特征提取及最强频率提取

将多元高斯分布拟合到给定的数据集

从音频文件中提取数据有哪些好的库？

wavenet的输入是什么？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐