首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏音频分析

    音频处理效率测评:audioflux、torchaudio、librosa和essentia库哪个更快?

    在本文中,我们将对四个常用的音频处理库——audioflux、torchaudio、librosa和essentia——进行性能测试,以评估它们在计算Mel频谱时的效率。 number of run_xxx.py calls, number-t: The time of each sample data, list测试单个库,使用以下方式:$ python run_audioflux.py 性能使用 audioFlux/torchaudio/librosa 库, 针对 AMD/Intel/M1 CPUs and Linux/macOS 系统。 在 linux/amd 处理器上,audioflux 比 torchaudio 稍快,但在 linux/intel 上稍慢。 在 macOS 系统上,对于大尺寸样本数据,audioflux 比 torchaudio 快,intel 比 m1 明显;对于小尺寸样本数据,torchaudio 比 audioflux 更快。

    2.4K80编辑于 2023-04-25
  • 来自专栏音频分析

    深度学习工具audioFlux--一个系统的音频特征提取库

    时频变换 audioFlux在时频分析领域中,包含以下通用变换(支持后续所有频率刻度类型)算法: BFT - 基于傅里叶变换。 audioFlux重排相关算法提供多次重排机制,具体效果可以参照文档做下尝试对比。 等等一小部分,关于audioFlux所提供的所有谱特征,更具体的功能描述、例子、公式等请参照官方文档。 下面是一些谱特征对比图。 图片 音乐信息检索 audioFlux提供mir相关领域pitch估算、onset侦测、hpss(谐波打击乐分离)等相关业务算法。 图片 最后,audioFlux是2023年初开源的一个项目,对此有兴趣或有意向的小伙伴可以积极参与到本项目中。

    3.1K110编辑于 2023-02-23
  • 来自专栏音频分析

    这样的速度,还有谁?一个 issue 引发的性能大跃进

    这是相关 issue 地址: https://github.com/libAudioFlux/audioFlux/issues/18#issuecomment-1498371872后面仔细分析发现,我当时测试数据样本尺寸太小 这是详细的测评报告: https://github.com/libAudioFlux/audioFlux/tree/master/benchmark综合来看,在 linux/amd 处理器上,audioflux 在 macOS 系统上,对于大尺寸样本数据,audioflux 比 torchaudio 快,intel 比 m1 明显; 对于小尺寸样本数据,torchaudio 比 audioflux 更快。 感兴趣的请给个 Star项目地址: https://github.com/libAudioFlux/audioFlux

    36930编辑于 2023-04-25
  • 来自专栏音频分析

    全球音频领域哪家强--盘点音频领域常用的python库

    audioFlux,音频特征较为全面,支持移动端,提供尽可能细粒度、体系化的特征维度和组合,但某些变换的逆操作尚未实现。 使用这些组合产生出更多细粒度的不同特征,训练出模型准确性和鲁棒性的研究, audioFlux库提供全面基础的支持,这是相比librosa等其它库优势的地方,期待后续借用audioFlux这个梯子,产生有价值的 对不同scale有不同程度支持的库有 audioFlux、essentia、madmom,其中 audioFlux最为系统和全面。 当前库中,仅有audioFlux支持CWT相关体系。 最后无聊的总结 最后总结一下, audioFlux是为研发和工程设计的,提供尽可能细粒度、体系化的特征维度和组合。 目前算的上体系的,audioFlux算一个,librosa算半个。 针对工程,要满足提取性能,尽量支持移动端(可选)。

    2.3K121编辑于 2023-02-23
  • 来自专栏音频分析

    这个小项目,上周被国外 AI 新闻网站报道,前些天又上了 github 热榜

    github 上一些爆火、优质的项目不值得一提,但相比之前几个 star 的情况好大多了,这是相关的文章:​​​https://www.marktechpost.com/2023/03/24/meet-audioflux-a-deep-learning-library-for-audio-and-music-analysis-feature-extraction 项目地址: ​​​https://github.com/libAudioFlux/audioFlux​ ​

    33150编辑于 2023-03-29
  • 来自专栏音频分析

    音频领域常用的谱特征

    这些谱特征都是频域数据各个维度高度抽象、总结、量化的结果,为业务后续研发提供思维的燃料,脑海里有没有很重要,至于烧不烧、怎么烧是另外一回事,但前提是先备好这些"燃料",幸运的是,audioFlux项目提供下面所列谱特征几乎所有的支持 14和15包含丰富多样的各种维度的Novelty相关方法,干货满满,每一个单独拎出来都可以作为一篇论文发表,建议使用audioFlux做详细的测试,一定会有不少的收获。 下面是一张使用audioFlux测试的部分特征效果图。 图片

    89170编辑于 2023-02-23
  • 来自专栏HelloGitHub

    最小编译器和 UI 框架「GitHub 热点速览」

    HG 评价地址→https://hellogithub.com/repository/5d7d9331d9934bc1859f4d060a6a776c 3.2 音频分析:audioFlux 主语言:C

    53720编辑于 2023-08-19
  • 来自专栏音频分析

    Mel频谱和MFCC深入浅出

    幸运的是audioFlux开源项目有比较标准的实现,感兴趣的朋友可以研究一下。 3. 基于上面算法流程,mel刻度产生mel频谱和mfcc特征,同样的流程,bark/erb等刻度产生对应的bark/erb频谱和相应倒谱系数,一些不同刻度频谱的对比图如下 图片 更多的不同刻度频谱类型可尝试使用audioFlux 也是一种特殊的窗函数,某种角度上讲甚至可以不计算,下面是几种不同窗下Filter bank的对比图 图片 下面是不同窗下的频谱对比图 图片 图中Slaney和ETSI是两种不同类型的三角窗,其它更多窗类型测试可尝试使用audioFlux

    3.1K90编辑于 2023-02-28
领券