腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
如何在java中提取
音频
特征
?
我的论文项目是
音频
特征
提取,它们的分类和比较。我只是有个可能行得通的主意。任何格式的
音频
都可以转换为pcm格式,并可以从中提取带宽、零交叉率、噪声帧比、基音强度和mel频率谱系数等
特征
。然后使用这些
特征
准备数据集,然后对其应用各种
音频
分类算法。请帮助我如何才能进一步提取
音频
特征
? 谢谢
浏览 0
提问于2011-02-02
得票数 4
1
回答
Ubuntu17.10:蓝牙不断崩溃
handle 0[336106.877531] usb
3-
device number 49[336107.217708] usb
3-
11: new full-speed USB device number 62 using xhci_hcd [336107.362900] usb
浏览 0
修改于2018-03-16
得票数 0
1
回答
用于机器学习/Logistic回归的三维矩阵
我正在做一个涉及
音频
的项目,其中对于矩阵X,n维是每个
音频
样本的
特征
,m维是我相互比较的
音频
文件的数量。我面临的问题是,对于每个
音频
文件,都有大量的
音频
样本(每44100个样本,我将其作为"1个样本“),每个样本包括每个不同的
特征
。我不是简单地取每个
音频
样本的每个
特征
的平均值,而是考虑如上所述向矩阵中添加第三个维度,即
音频
样本。问题是,我不知道这在逻辑回归中如何成立/我可以期望我的输出变量y是什么
浏览 0
提问于2018-12-23
得票数 0
3
回答
检测
音频
流中的
特征
我想编写/编程/开发一种算法,它可以识别/麦克风
音频
线路中数据中的许多
特征
。
音频
流将是音乐,我想过滤掉
特征
来区分歌曲,通过区分,我的意思是你可以区分歌曲的流派。FFT是从
音频
流中获得不同
特征
的一个很好的开始,但我不知道从哪里开始。有没有可能用FFT得到小节/节拍?关于这一点,有没有什么好的教程/代码示例?FFT是否足以获得
音频
流的良好
特征
,或者是否有其他算法可以很好地获取
音频
流的<em
浏览 1
修改于2013-04-20
得票数 5
1
回答
在google的
音频
集中,使用什么算法进行
音频
特征
提取?
虽然数据集是广泛的,但我发现有关
音频
特征
提取的信息非常模糊。网站提到 在中,作者讨论了在960毫秒块上使用mel谱图来获得96x64表示。
浏览 5
提问于2017-05-19
得票数 1
回答已采纳
1
回答
基于MFCC的
特征
提取
我想知道,如何提取
音频
(x.wav)信号,用MFCC进行
特征
提取?我知道使用MFCC提取
音频
特征
的步骤。我想知道使用Django框架在Python中进行的详细编码
浏览 66
修改于2019-05-12
得票数 2
回答已采纳
3
回答
使用OpenSMILE从实时输入中提取
音频
特征
我可以使用OpenSMILE从存储在系统中的
音频
文件中提取
特征
。但我需要使用相同的OpenSMILE实时提取
特征
。有没有可能不保存录制的
音频
文件?
浏览 6
修改于2014-07-17
得票数 1
2
回答
缓慢启动: xhci_hcd 0000:00:14.0:等待安装设备命令时超时
例如,哇哦,我应该读这行usb
3-11
: device descriptor read/64, error -110吗?$ dmesg[ 18.840539] usb
3-11
: device descriptor read/64, error -110[ 34.720461] usb
3-11
: new full-speed USB devic
浏览 0
修改于2020-06-21
得票数 4
2
回答
中餐过程可能与距离相关
我是机器学习的新手,我想在MATLAB中实现与距离相关的中餐厅过程,用于
音频
轨迹的聚类。 我将运行该算法,例如,16声道。
音频
输入算法的方
浏览 0
修改于2013-11-12
得票数 1
2
回答
最能描述音乐的
音频
功能是什么?
我正在为
音频
流项目设计推荐系统的基于内容的过滤部分。为了你的答案。编辑: 音乐节奏持续时间光谱滚转光谱带宽我想知道这些
音频
特征
在多大程度上与“描述”
音频
摘录有关。
浏览 0
修改于2019-04-25
得票数 2
3
回答
如何使用两个
特征
向量来训练向量机?
numpy数组的尺寸如下:Image=(360,5)->
特征
是从这些
音频
文件的谱图中提取出来的。我还试图将这两个数组连接起来,但尺寸不同。我怎样才能解决这个问题?
浏览 1
提问于2017-09-15
得票数 3
回答已采纳
2
回答
两个
音频
序列之间的感知相似性
我想测量两段
音频
之间的距离。例如,我想将动物的声音与人类模仿动物的声音进行比较,然后返回声音相似程度的分数。 这似乎是一个很难的问题。什么是处理它的最好方法?我在考虑从
音频
信号中提取几个
特征
,然后对这些
特征
进行欧几里得距离或余弦相似度(或类似的东西)。什么样的
特征
容易提取并有助于确定声音之间的感知差异?(我在某个地方看到Shazam使用散列,但这是一个不同的问题,因为被比较的两段
音频
基本上是相同的,但其中一段有更多噪音。在这里,这两段
音频
并不相同,它们只是在感知上相似。
浏览 9
修改于2020-07-03
得票数 18
1
回答
将多元高斯分布拟合到给定的数据集
我需要拟合多变量高斯分布,即获得python中给定
音频
特征
数据集的最接近多变量高斯的均值向量和协方差矩阵。
音频
特征
(MFCC系数)是N×13矩阵,其中N约为4K。
浏览 6
提问于2014-12-01
得票数 13
1
回答
基于受限boltzmann机器的
音频
特征
提取
我想使用RBM (受限玻尔兹曼机)提取
音频
特征
。为此,我给出了频谱图(PCA白化)作为RBM的输入。“然后,我们训练了300个第一层基础,过滤器长度为6,最大池比率为3
浏览 1
提问于2013-12-13
得票数 2
1
回答
wavenet的输入是什么?
原始论文,解释了为局部条件作用添加时间序列,解释说,为局部条件作用添加mel频谱图
特征
是很好的。如我们所知,Wavenet是一种生成模型,并且在经过调节时采用原始
音频
输入来生成高
音频
输出,请帮帮忙,这是非常需要的。 谢谢
浏览 1
提问于2019-12-09
得票数 3
1
回答
为什么使用Lapply时出现服务不可用错误?
我正在使用spotifyr库,在那里我想找到多首曲目的
音频
特征
。例如,我可以这样做,以便使用其id查找特定歌曲的
音频
特征
。authorization = get_spotify_access_token()) 昨天,我在下面写了一个函数,它获取数据帧中的所有曲目,找到所有曲目的
音频
特征
我仍然能够找到特定歌曲的
音频
功能,所以我不确定哪种服务不可用。
浏览 13
提问于2020-12-28
得票数 0
4
回答
用于使用librosa进行
音频
分类的MFCC
特征
描述符
我正在尝试为
音频
文件获取单向量
特征
表示,以用于机器学习任务(具体地说,使用神经网络进行分类)。我在计算机视觉和自然语言处理方面有经验,但我需要一些帮助来加快
音频
文件的速度。
音频
文件有各种各样的
特征
描述符,但MFCC似乎是用于
音频
分类任务最多的。我的问题是:如何获取
音频
文件的MFCC表示,它通常是一个矩阵(假设是系数矩阵),并将其转换为单个
特征
向量?我有一堆
音频
文件,但它们的形状各不相同: for filename in os.list
浏览 4
提问于2014-09-23
得票数 13
2
回答
JAudio要素提取器不提取特定文件的要素
我正在使用jAudio软件进行
音频
文件的
特征
提取。我正在使用aiff,au,wav等文件格式的文件。它提取文件的
特征
与帧速率为16000帧每秒,通道:立体声,帧大小:16位等。因此,我的文件具有更高的
特征
值,并且在转换时会出现错误。请还建议一个软件,转换
音频
文件格式,要求这些
特征
值,同时转换。
浏览 0
提问于2011-03-29
得票数 0
1
回答
如何使用python将长
音频
(例如:1小时)文件拆分成多个短长度(5s)
音频
文件
我有一些长的
音频
文件,我想使用python.Ex:The
音频
将这个
音频
文件分割成多个短长度的
音频
文件,长的长度超过1小时,并想分割成多个短长度的5s文件。我想在每个5s中提取整个
音频
文件的
特征
。
浏览 2
修改于2020-08-29
得票数 0
1
回答
上采样/内插视频
特征
的简单技术?
我正在尝试同时分析
音频
和视觉
特征
。我的
音频
语音
特征
是使用隐马尔可夫模型工具包以100fps采样的mel频率倒谱系数。我的视觉
特征
来自我构建的嘴唇跟踪程序,采样速度为29.97fps。我知道我需要插入我的视觉
特征
,以便采样率也是100fps,但我找不到一个很好的解释或在线教程如何做到这一点。我发现的大多数帮助来自语音识别社区,他们代表读者假设有插值知识,即大多数人用一个简单的“插值视觉
特征
,以便采样率等于100fps”来覆盖这一步骤。万分感
浏览 0
修改于2012-01-02
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券