首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何提取音频数据以便进行比较?

如何提取音频数据以便进行比较?
EN

Stack Overflow用户
提问于 2014-05-22 10:31:09
回答 1查看 148关注 0票数 0

我正在做一个涉及机器学习和数据比较的项目。

为了这个项目的目的,我向一个神经元网络提供抽象的视频数据。

现在,抽象图像数据非常简单。我可以在视频中的某些点取静止帧,将它们缩小为5×5像素(或任何其他可管理的分辨率),并得到像素值以供分析。

由此产生的数据提供了一个独特的、小的、数据丰富的样本(即使是5x5px的5个样本也足以将戏剧与自然纪录片区分开来,等等)。

然而,我被卡在音频部分。由于音频由样本组成,每个样本本身没有固有的意义,所以我无法找到将音频抽象为可处理块的方法。

这一过程是否有共同的技术?如果没有,可以量化和抽象音频数据的指标是什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-05-22 20:36:43

您需要的过程是音频特征提取。有大量的特征检测算法,通常专门用于音乐或语音信号。对于音乐来说,色彩、节奏、和声分布都是你可以提取的特征--还有更多。通常情况下,音频特征提取算法在相当宏观的层次上工作-也就是说,一次有数千个样本。

一个很好的起点是声波视觉器,它是音频可视化算法的插件主机--其中许多都是特征提取器。

亚阿菲可能也有一些有用的东西。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23804298

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档