搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

2回答

如何在java中提取音频特征？

我的论文项目是音频特征提取，它们的分类和比较。我只是有个可能行得通的主意。任何格式的音频都可以转换为pcm格式，并可以从中提取带宽、零交叉率、噪声帧比、基音强度和mel频率谱系数等特征。然后使用这些特征准备数据集，然后对其应用各种音频分类算法。请帮助我如何才能进一步提取音频特征？谢谢

浏览 0提问于2011-02-02得票数 4

1回答

我正在做一个涉及音频的项目，其中对于矩阵X，n维是每个音频样本的特征，m维是我相互比较的音频文件的数量。我面临的问题是，对于每个音频文件，都有大量的音频样本(每44100个样本，我将其作为"1个样本“)，每个样本包括每个不同的特征。我不是简单地取每个音频样本的每个特征的平均值，而是考虑如上所述向矩阵中添加第三个维度，即音频样本。问题是，我不知道这在逻辑回归中如何成立/我可以期望我的输出变量y是什么

浏览 0提问于2018-12-23得票数 0

3回答

检测音频流中的特征

我想编写/编程/开发一种算法，它可以识别/麦克风音频线路中数据中的许多特征。音频流将是音乐，我想过滤掉特征来区分歌曲，通过区分，我的意思是你可以区分歌曲的流派。FFT是从音频流中获得不同特征的一个很好的开始，但我不知道从哪里开始。有没有可能用FFT得到小节/节拍？关于这一点，有没有什么好的教程/代码示例？FFT是否足以获得音频流的良好特征，或者是否有其他算法可以很好地获取音频流的<em

浏览 1修改于2013-04-20得票数 5

1回答

在google的音频集中，使用什么算法进行音频特征提取？

虽然数据集是广泛的，但我发现有关音频特征提取的信息非常模糊。网站提到在中，作者讨论了在960毫秒块上使用mel谱图来获得96x64表示。

浏览 5提问于2017-05-19得票数 1

回答已采纳

1回答

基于MFCC的特征提取

我想知道，如何提取音频(x.wav)信号，用MFCC进行特征提取？我知道使用MFCC提取音频特征的步骤。我想知道使用Django框架在Python中进行的详细编码

浏览 66修改于2019-05-12得票数 2

回答已采纳

3回答

使用OpenSMILE从实时输入中提取音频特征

我可以使用OpenSMILE从存储在系统中的音频文件中提取特征。但我需要使用相同的OpenSMILE实时提取特征。有没有可能不保存录制的音频文件？

浏览 6修改于2014-07-17得票数 1

1回答

如何防止音频重叠？

窗体2-4有一个按钮，按下该按钮将播放窗体1中的特定声音。有时三个窗体中的所有按钮几乎同时按下，这会导致窗体1中播放的音频彼此重叠。我如何防止这种情况发生？编辑:当所有按钮都被按下时，我希望音频在播放时“轮流”播放。“音频2，3”必须等待“音频1”播放完毕才能播放，然后音频3“也必须等待”音频2“结束。每个”音频播放“都由一个SpeechSynthesizer (使用.SpeakAsync播放)和一个SoundPlayer (使用.PlaySync播放

浏览 0修改于2018-09-01得票数 1

1回答

廉价的PC机，USBTV007设备，没有声音

对于音频输入，它只表示1,0和1,2 -我不知道这意味着什么。我试着一次选择每一个，然后尝试捕捉。发现我必须在VLC的“高级选项”中设置视频的高度和宽度--它们显然默认为0，这意味着我没有视频。但是，我没有任何音频。我在网上做了一些阅读，似乎我应该有另一个音频设备显示时，棍子被插入，但我没有得到一个新的。网络上的另一个项目说要检查dmesg，看看它显示了什么。] usb 2-4: New USB device found, idVendor=1b71, idProduct=3002 {102957.029239] usb

浏览 0修改于2014-12-17得票数 1

2回答

中餐过程可能与距离相关

我是机器学习的新手，我想在MATLAB中实现与距离相关的中餐厅过程，用于音频轨迹的聚类。我将运行该算法，例如，16声道。音频输入算法的方

浏览 0修改于2013-11-12得票数 1

3回答

如何使用两个特征向量来训练向量机？

numpy数组的尺寸如下：Image=(360，5)->特征是从这些音频文件的谱图中提取出来的。我还试图将这两个数组连接起来，但尺寸不同。我怎样才能解决这个问题？

浏览 1提问于2017-09-15得票数 3

回答已采纳

2回答

最能描述音乐的音频功能是什么？

我正在为音频流项目设计推荐系统的基于内容的过滤部分。为了你的答案。编辑：音乐节奏持续时间光谱滚转光谱带宽我想知道这些音频特征在多大程度上与“描述”音频摘录有关。

浏览 0修改于2019-04-25得票数 2

1回答

Gstreamer使用(Uri)解码器播放视频文件中的音频- CPU使用率高

我使用gstreamer来转换来自文件/RTMP/RTSP流的音频，然后对其进行分析。示例2(上述视频文件中的音频通过ffmpeg副本转换)-使用2-4%的-c如何指定只需要视频文件中的音频源？我之所以使用decodebin，是因为我不知道我会从用

浏览 0提问于2017-05-28得票数 1

2回答

两个音频序列之间的感知相似性

我想测量两段音频之间的距离。例如，我想将动物的声音与人类模仿动物的声音进行比较，然后返回声音相似程度的分数。这似乎是一个很难的问题。什么是处理它的最好方法？我在考虑从音频信号中提取几个特征，然后对这些特征进行欧几里得距离或余弦相似度(或类似的东西)。什么样的特征容易提取并有助于确定声音之间的感知差异？(我在某个地方看到Shazam使用散列，但这是一个不同的问题，因为被比较的两段音频基本上是相同的，但其中一段有更多噪音。在这里，这两段音频并不相同，它们只是在感知上相似。

浏览 9修改于2020-07-03得票数 18

1回答

将多元高斯分布拟合到给定的数据集

我需要拟合多变量高斯分布，即获得python中给定音频特征数据集的最接近多变量高斯的均值向量和协方差矩阵。音频特征(MFCC系数)是N×13矩阵，其中N约为4K。

浏览 6提问于2014-12-01得票数 13

1回答

基于受限boltzmann机器的音频特征提取

我想使用RBM (受限玻尔兹曼机)提取音频特征。为此，我给出了频谱图(PCA白化)作为RBM的输入。“然后，我们训练了300个第一层基础，过滤器长度为6，最大池比率为3

浏览 1提问于2013-12-13得票数 2

1回答

wavenet的输入是什么？

原始论文，解释了为局部条件作用添加时间序列，解释说，为局部条件作用添加mel频谱图特征是很好的。如我们所知，Wavenet是一种生成模型，并且在经过调节时采用原始音频输入来生成高音频输出，请帮帮忙，这是非常需要的。谢谢

浏览 1提问于2019-12-09得票数 3

1回答

为什么使用Lapply时出现服务不可用错误？

我正在使用spotifyr库，在那里我想找到多首曲目的音频特征。例如，我可以这样做，以便使用其id查找特定歌曲的音频特征。authorization = get_spotify_access_token()) 昨天，我在下面写了一个函数，它获取数据帧中的所有曲目，找到所有曲目的音频特征我仍然能够找到特定歌曲的音频功能，所以我不确定哪种服务不可用。

浏览 13提问于2020-12-28得票数 0

4回答

用于使用librosa进行音频分类的MFCC特征描述符

我正在尝试为音频文件获取单向量特征表示，以用于机器学习任务(具体地说，使用神经网络进行分类)。我在计算机视觉和自然语言处理方面有经验，但我需要一些帮助来加快音频文件的速度。音频文件有各种各样的特征描述符，但MFCC似乎是用于音频分类任务最多的。我的问题是:如何获取音频文件的MFCC表示，它通常是一个矩阵(假设是系数矩阵)，并将其转换为单个特征向量？我有一堆音频文件，但它们的形状各不相同： for filename in os.list

浏览 4提问于2014-09-23得票数 13

2回答

JAudio要素提取器不提取特定文件的要素

我正在使用jAudio软件进行音频文件的特征提取。我正在使用aiff，au，wav等文件格式的文件。它提取文件的特征与帧速率为16000帧每秒，通道:立体声，帧大小:16位等。因此，我的文件具有更高的特征值，并且在转换时会出现错误。请还建议一个软件，转换音频文件格式，要求这些特征值，同时转换。

浏览 0提问于2011-03-29得票数 0

1回答

如何使用python将长音频(例如:1小时)文件拆分成多个短长度(5s)音频文件

我有一些长的音频文件，我想使用python.Ex:The音频将这个音频文件分割成多个短长度的音频文件，长的长度超过1小时，并想分割成多个短长度的5s文件。我想在每个5s中提取整个音频文件的特征。

浏览 2修改于2020-08-29得票数 0

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

如何在java中提取音频特征？

用于机器学习/Logistic回归的三维矩阵

检测音频流中的特征

在google的音频集中，使用什么算法进行音频特征提取？

基于MFCC的特征提取

使用OpenSMILE从实时输入中提取音频特征

如何防止音频重叠？

廉价的PC机，USBTV007设备，没有声音

中餐过程可能与距离相关

如何使用两个特征向量来训练向量机？

最能描述音乐的音频功能是什么？

Gstreamer使用(Uri)解码器播放视频文件中的音频- CPU使用率高

两个音频序列之间的感知相似性

将多元高斯分布拟合到给定的数据集

基于受限boltzmann机器的音频特征提取

wavenet的输入是什么？

为什么使用Lapply时出现服务不可用错误？

用于使用librosa进行音频分类的MFCC特征描述符

JAudio要素提取器不提取特定文件的要素

如何使用python将长音频(例如:1小时)文件拆分成多个短长度(5s)音频文件

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐