腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
如何在java中提取
音频
特征
?
我的论文项目是
音频
特征
提取,它们的分类和比较。我只是有个可能行得通的主意。任何格式的
音频
都可以转换为pcm格式,并可以从中提取带宽、零交叉率、噪声帧比、基音强度和mel频率谱系数等
特征
。然后使用这些
特征
准备数据集,然后对其应用各种
音频
分类算法。请帮助我如何才能进一步提取
音频
特征
? 谢谢
浏览 0
提问于2011-02-02
得票数 4
1
回答
用于机器学习/Logistic回归的三维矩阵
我正在做一个涉及
音频
的项目,其中对于矩阵X,n维是每个
音频
样本的
特征
,m维是我相互比较的
音频
文件的数量。我面临的问题是,对于每个
音频
文件,都有大量的
音频
样本(每44100个样本,我将其作为"1个样本“),每个样本包括每个不同的
特征
。我不是简单地取每个
音频
样本的每个
特征
的平均值,而是考虑如上所述向矩阵中添加第三个维度,即
音频
样本。问题是,我不知道这在逻辑回归中如何成立/我可以期望我的输出变量y是什么
浏览 0
提问于2018-12-23
得票数 0
3
回答
检测
音频
流中的
特征
我想编写/编程/开发一种算法,它可以识别/麦克风
音频
线路中数据中的许多
特征
。
音频
流将是音乐,我想过滤掉
特征
来区分歌曲,通过区分,我的意思是你可以区分歌曲的流派。FFT是从
音频
流中获得不同
特征
的一个很好的开始,但我不知道从哪里开始。有没有可能用FFT得到小节/节拍?关于这一点,有没有什么好的教程/代码示例?FFT是否足以获得
音频
流的良好
特征
,或者是否有其他算法可以很好地获取
音频
流的<em
浏览 1
修改于2013-04-20
得票数 5
1
回答
在google的
音频
集中,使用什么算法进行
音频
特征
提取?
虽然数据集是广泛的,但我发现有关
音频
特征
提取的信息非常模糊。网站提到 在中,作者讨论了在960毫秒块上使用mel谱图来获得96x64表示。
浏览 5
提问于2017-05-19
得票数 1
回答已采纳
1
回答
基于MFCC的
特征
提取
我想知道,如何提取
音频
(x.wav)信号,用MFCC进行
特征
提取?我知道使用MFCC提取
音频
特征
的步骤。我想知道使用Django框架在Python中进行的详细编码
浏览 66
修改于2019-05-12
得票数 2
回答已采纳
3
回答
使用OpenSMILE从实时输入中提取
音频
特征
我可以使用OpenSMILE从存储在系统中的
音频
文件中提取
特征
。但我需要使用相同的OpenSMILE实时提取
特征
。有没有可能不保存录制的
音频
文件?
浏览 6
修改于2014-07-17
得票数 1
2
回答
中餐过程可能与距离相关
我是机器学习的新手,我想在MATLAB中实现与距离相关的中餐厅过程,用于
音频
轨迹的聚类。 我将运行该算法,例如,16声道。
音频
输入算法的方
浏览 0
修改于2013-11-12
得票数 1
3
回答
如何使用两个
特征
向量来训练向量机?
numpy数组的尺寸如下:Image=(360,5)->
特征
是从这些
音频
文件的谱图中提取出来的。我还试图将这两个数组连接起来,但尺寸不同。我怎样才能解决这个问题?
浏览 1
提问于2017-09-15
得票数 3
回答已采纳
2
回答
最能描述音乐的
音频
功能是什么?
我正在为
音频
流项目设计推荐系统的基于内容的过滤部分。为了你的答案。编辑: 音乐节奏持续时间光谱滚转光谱带宽我想知道这些
音频
特征
在多大程度上与“描述”
音频
摘录有关。
浏览 0
修改于2019-04-25
得票数 2
2
回答
两个
音频
序列之间的感知相似性
我想测量两段
音频
之间的距离。例如,我想将动物的声音与人类模仿动物的声音进行比较,然后返回声音相似程度的分数。 这似乎是一个很难的问题。什么是处理它的最好方法?我在考虑从
音频
信号中提取几个
特征
,然后对这些
特征
进行欧几里得距离或余弦相似度(或类似的东西)。什么样的
特征
容易提取并有助于确定声音之间的感知差异?(我在某个地方看到Shazam使用散列,但这是一个不同的问题,因为被比较的两段
音频
基本上是相同的,但其中一段有更多噪音。在这里,这两段
音频
并不相同,它们只是在感知上相似。
浏览 9
修改于2020-07-03
得票数 18
1
回答
将多元高斯分布拟合到给定的数据集
我需要拟合多变量高斯分布,即获得python中给定
音频
特征
数据集的最接近多变量高斯的均值向量和协方差矩阵。
音频
特征
(MFCC系数)是N×13矩阵,其中N约为4K。
浏览 6
提问于2014-12-01
得票数 13
1
回答
wavenet的输入是什么?
原始论文,解释了为局部条件作用添加时间序列,解释说,为局部条件作用添加mel频谱图
特征
是很好的。如我们所知,Wavenet是一种生成模型,并且在经过调节时采用原始
音频
输入来生成高
音频
输出,请帮帮忙,这是非常需要的。 谢谢
浏览 1
提问于2019-12-09
得票数 3
1
回答
Regex在文本中找不到电话号码
:\(\s*([
2-9
]1[02-9]|[
2-9
][02-8]1|[
2-9
][02-8][02-9])\s*\)|([
2-9
]1[02-9]|[
2-9
][02-8]1|[
2-9
][02-8][02-9]([
2-9
]1[02-9]|[
2-9
][02-9]1|[
2-9
][02-9]{2})\s*(?:[.-]\s*)?([0-9]{3})(?:\s*(?:#|x\.?|ext\.?
浏览 0
提问于2018-06-22
得票数 0
回答已采纳
1
回答
基于受限boltzmann机器的
音频
特征
提取
我想使用RBM (受限玻尔兹曼机)提取
音频
特征
。为此,我给出了频谱图(PCA白化)作为RBM的输入。“然后,我们训练了300个第一层基础,过滤器长度为6,最大池比率为3
浏览 1
提问于2013-12-13
得票数 2
2
回答
使用preg_match获取电话号码的帮助
:\(\s*([
2-9
]1[02-9]|[
2-9
][02-8]1|[
2-9
][02-8][02-9])\s*\)|([
2-9
]1[02-9]|[
2-9
][02-8]1|[
2-9
][02-8][02-9]([
2-9
]1[02-9]|[
2-9
][02-9]1|[
2-9
][02-9]{2})\s*(?:[.-]\s*)?([0-9]{4})(?:\s*(?:#|x\.?|ext\.?
浏览 0
修改于2010-05-14
得票数 0
2
回答
<input>上模式“HTML5”属性的Javascript回退
:\(\s*([
2-9
]1[02-9]|[
2-9
][02-8]1|[
2-9
][02-8][02-9])\s*\)|([
2-9
]1[02-9]|[
2-9
][02-8]1|[
2-9
][02-8][02-9]([
2-9
]1[02-9]|[
2-9
][02-9]1|[
2-9
][02-9]{2})\s*(?:[.-]\s*)?([0-9]{4})(?:\s*(?:#|x\.?|ext\.?
浏览 1
提问于2011-11-28
得票数 7
回答已采纳
1
回答
电话正则表达式的Python“无效语法错误”
:\(\s*([
2-9
]1[02-9]|[
2-9
][02-8]1|[
2-9
][02-8][02-9])\s*\)|([
2-9
]1[02-9]|[
2-9
][02-8]1|[
2-9
][02-8][02-9]([
2-9
]1[02-9]|[
2-9
][02-9]1|[
2-9
][02-9]{2})\s*(?:[.-]\s*)?([0-9]{4})(?:\s*(?:#|x\.?|ext\.?
浏览 2
修改于2017-05-23
得票数 0
回答已采纳
1
回答
为什么使用Lapply时出现服务不可用错误?
我正在使用spotifyr库,在那里我想找到多首曲目的
音频
特征
。例如,我可以这样做,以便使用其id查找特定歌曲的
音频
特征
。authorization = get_spotify_access_token()) 昨天,我在下面写了一个函数,它获取数据帧中的所有曲目,找到所有曲目的
音频
特征
我仍然能够找到特定歌曲的
音频
功能,所以我不确定哪种服务不可用。
浏览 13
提问于2020-12-28
得票数 0
2
回答
选择包含电话号码的线路的regex
718-951-5000,718.951.5000,(718)-951-5000 "(^(\([
2-9
]\\d{2}\)|[
2-9
]\\d{2})[- .]?\d{3}[- .]?\\d{4}$)|(^(\([
2-9
]\\d{2}\)|[
2-9
]\\d{2})[- .]?\d{3}[- .]?\\d{4}[xX]\\d{1,4}$)" "(^(\([
2-9
]\
浏览 1
修改于2012-09-21
得票数 2
回答已采纳
4
回答
用于使用librosa进行
音频
分类的MFCC
特征
描述符
我正在尝试为
音频
文件获取单向量
特征
表示,以用于机器学习任务(具体地说,使用神经网络进行分类)。我在计算机视觉和自然语言处理方面有经验,但我需要一些帮助来加快
音频
文件的速度。
音频
文件有各种各样的
特征
描述符,但MFCC似乎是用于
音频
分类任务最多的。我的问题是:如何获取
音频
文件的MFCC表示,它通常是一个矩阵(假设是系数矩阵),并将其转换为单个
特征
向量?我有一堆
音频
文件,但它们的形状各不相同: for filename in os.list
浏览 4
提问于2014-09-23
得票数 13
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券