腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
如何使用python将长
音频
(例如:1小时)文件拆分成多个短长度(
5
s)
音频
文件
我有一些长的
音频
文件,我想使用python.Ex:The
音频
将这个
音频
文件分割成多个短长度的
音频
文件,长的长度超过1小时,并想分割成多个短长度的
5
s文件。我想在每个
5
s中提取整个
音频
文件的
特征
。
浏览 2
修改于2020-08-29
得票数 0
3
回答
如何使用两个
特征
向量来训练向量机?
numpy数组的尺寸如下:Image=(360,
5
)->
特征
是从这些
音频
文件的谱图中提取出来的。我还试图将这两个数组连接起来,但尺寸不同。我怎样才能解决这个问题?
浏览 1
提问于2017-09-15
得票数 3
回答已采纳
2
回答
如何在java中提取
音频
特征
?
我的论文项目是
音频
特征
提取,它们的分类和比较。我只是有个可能行得通的主意。任何格式的
音频
都可以转换为pcm格式,并可以从中提取带宽、零交叉率、噪声帧比、基音强度和mel频率谱系数等
特征
。然后使用这些
特征
准备数据集,然后对其应用各种
音频
分类算法。请帮助我如何才能进一步提取
音频
特征
? 谢谢
浏览 0
提问于2011-02-02
得票数 4
1
回答
数字语音识别中的
特征
提取
我正在寻找一种从
音频
中提取
特征
的方法,其中我说了一个数字,用于使用神经网络的反向传播对数字1-10进行语音识别(每个数字10个样本,每个数字
5
个样本用于测试)。我尝试使用原始
音频
数据,也尝试在fft之后输入数据,并仅使用前十个频率输入数据,但失败了。 你能建议一种方法来提取
音频
的
特征
,以帮助神经网络获得合理的结果吗?
浏览 0
修改于2015-05-16
得票数 0
1
回答
用于机器学习/Logistic回归的三维矩阵
我正在做一个涉及
音频
的项目,其中对于矩阵X,n维是每个
音频
样本的
特征
,m维是我相互比较的
音频
文件的数量。我面临的问题是,对于每个
音频
文件,都有大量的
音频
样本(每44100个样本,我将其作为"1个样本“),每个样本包括每个不同的
特征
。我不是简单地取每个
音频
样本的每个
特征
的平均值,而是考虑如上所述向矩阵中添加第三个维度,即
音频
样本。问题是,我不知道这在逻辑回归中如何成立/我可以期望我的输出变量y是什么
浏览 0
提问于2018-12-23
得票数 0
3
回答
检测
音频
流中的
特征
我想编写/编程/开发一种算法,它可以识别/麦克风
音频
线路中数据中的许多
特征
。
音频
流将是音乐,我想过滤掉
特征
来区分歌曲,通过区分,我的意思是你可以区分歌曲的流派。FFT是从
音频
流中获得不同
特征
的一个很好的开始,但我不知道从哪里开始。有没有可能用FFT得到小节/节拍?关于这一点,有没有什么好的教程/代码示例?FFT是否足以获得
音频
流的良好
特征
,或者是否有其他算法可以很好地获取
音频
流的<em
浏览 1
修改于2013-04-20
得票数 5
1
回答
在google的
音频
集中,使用什么算法进行
音频
特征
提取?
虽然数据集是广泛的,但我发现有关
音频
特征
提取的信息非常模糊。网站提到 在中,作者讨论了在960毫秒块上使用mel谱图来获得96x64表示。
浏览 5
提问于2017-05-19
得票数 1
回答已采纳
1
回答
基于MFCC的
特征
提取
我想知道,如何提取
音频
(x.wav)信号,用MFCC进行
特征
提取?我知道使用MFCC提取
音频
特征
的步骤。我想知道使用Django框架在Python中进行的详细编码
浏览 66
修改于2019-05-12
得票数 2
回答已采纳
3
回答
使用OpenSMILE从实时输入中提取
音频
特征
我可以使用OpenSMILE从存储在系统中的
音频
文件中提取
特征
。但我需要使用相同的OpenSMILE实时提取
特征
。有没有可能不保存录制的
音频
文件?
浏览 6
修改于2014-07-17
得票数 1
2
回答
中餐过程可能与距离相关
我是机器学习的新手,我想在MATLAB中实现与距离相关的中餐厅过程,用于
音频
轨迹的聚类。 我将运行该算法,例如,16声道。
音频
输入算法的方
浏览 0
修改于2013-11-12
得票数 1
3
回答
使用Python从
音频
文件中提取F0、抖动和shimmer
最近我得到了这样的任务:从给定的短
音频
文件链中提取诸如F0(基频)、Jitter和Shimmer等
特征
(大约
5
-10秒,一个声音在一个音符上唱歌)。而且,不幸的是,我在
音频
信号处理方面一无是处。
浏览 0
提问于2019-01-31
得票数 0
回答已采纳
2
回答
最能描述音乐的
音频
功能是什么?
我正在为
音频
流项目设计推荐系统的基于内容的过滤部分。为了你的答案。编辑: 音乐节奏持续时间光谱滚转光谱带宽我想知道这些
音频
特征
在多大程度上与“描述”
音频
摘录有关。
浏览 0
修改于2019-04-25
得票数 2
6
回答
声音的YouTube
是否有专门为
音频
文件提供的免费托管服务,以便通过flash/html
5
5
接口轻松嵌入播放? (我不担心社交
特征
,比如评论)
浏览 0
修改于2010-08-08
得票数 4
回答已采纳
2
回答
两个
音频
序列之间的感知相似性
我想测量两段
音频
之间的距离。例如,我想将动物的声音与人类模仿动物的声音进行比较,然后返回声音相似程度的分数。 这似乎是一个很难的问题。什么是处理它的最好方法?我在考虑从
音频
信号中提取几个
特征
,然后对这些
特征
进行欧几里得距离或余弦相似度(或类似的东西)。什么样的
特征
容易提取并有助于确定声音之间的感知差异?(我在某个地方看到Shazam使用散列,但这是一个不同的问题,因为被比较的两段
音频
基本上是相同的,但其中一段有更多噪音。在这里,这两段
音频
并不相同,它们只是在感知上相似。
浏览 9
修改于2020-07-03
得票数 18
1
回答
将多元高斯分布拟合到给定的数据集
我需要拟合多变量高斯分布,即获得python中给定
音频
特征
数据集的最接近多变量高斯的均值向量和协方差矩阵。
音频
特征
(MFCC系数)是N×13矩阵,其中N约为4K。
浏览 6
提问于2014-12-01
得票数 13
1
回答
wavenet的输入是什么?
原始论文,解释了为局部条件作用添加时间序列,解释说,为局部条件作用添加mel频谱图
特征
是很好的。如我们所知,Wavenet是一种生成模型,并且在经过调节时采用原始
音频
输入来生成高
音频
输出,请帮帮忙,这是非常需要的。 谢谢
浏览 1
提问于2019-12-09
得票数 3
1
回答
基于受限boltzmann机器的
音频
特征
提取
我想使用RBM (受限玻尔兹曼机)提取
音频
特征
。为此,我给出了频谱图(PCA白化)作为RBM的输入。“然后,我们训练了300个第一层基础,过滤器长度为6,最大池比率为3
浏览 1
提问于2013-12-13
得票数 2
1
回答
为什么使用Lapply时出现服务不可用错误?
我正在使用spotifyr库,在那里我想找到多首曲目的
音频
特征
。例如,我可以这样做,以便使用其id查找特定歌曲的
音频
特征
。authorization = get_spotify_access_token()) 昨天,我在下面写了一个函数,它获取数据帧中的所有曲目,找到所有曲目的
音频
特征
我仍然能够找到特定歌曲的
音频
功能,所以我不确定哪种服务不可用。
浏览 13
提问于2020-12-28
得票数 0
4
回答
用于使用librosa进行
音频
分类的MFCC
特征
描述符
我正在尝试为
音频
文件获取单向量
特征
表示,以用于机器学习任务(具体地说,使用神经网络进行分类)。我在计算机视觉和自然语言处理方面有经验,但我需要一些帮助来加快
音频
文件的速度。
音频
文件有各种各样的
特征
描述符,但MFCC似乎是用于
音频
分类任务最多的。我的问题是:如何获取
音频
文件的MFCC表示,它通常是一个矩阵(假设是系数矩阵),并将其转换为单个
特征
向量?我有一堆
音频
文件,但它们的形状各不相同: for filename in os.list
浏览 4
提问于2014-09-23
得票数 13
2
回答
JAudio要素提取器不提取特定文件的要素
我正在使用jAudio软件进行
音频
文件的
特征
提取。我正在使用aiff,au,wav等文件格式的文件。它提取文件的
特征
与帧速率为16000帧每秒,通道:立体声,帧大小:16位等。因此,我的文件具有更高的
特征
值,并且在转换时会出现错误。请还建议一个软件,转换
音频
文件格式,要求这些
特征
值,同时转换。
浏览 0
提问于2011-03-29
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券