首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用OpenSMILE从实时输入中提取音频特征

使用OpenSMILE从实时输入中提取音频特征
EN

Stack Overflow用户
提问于 2014-01-15 00:10:31
回答 3查看 3.7K关注 0票数 1

我可以使用OpenSMILE从存储在系统中的音频文件中提取特征。但我需要使用相同的OpenSMILE实时提取特征。有没有可能不保存录制的音频文件?

EN

回答 3

Stack Overflow用户

发布于 2014-01-15 00:21:36

似乎它可能会支持它。从manual

要检查您的SMILExtract二进制文件是否支持实时音频录制和播放,请键入:SMILExtract -H cPortaudio

组件cPortaudioSource和cPortaudioSink可用作cWaveSource和cWaveSink的替代品。它们以与wave组件相同的格式产生/期望数据。

万岁的互联网搜索...

票数 2
EN

Stack Overflow用户

发布于 2017-04-22 17:13:49

您可能还需要一个cTurnDetector组件(请参阅http://opensmile.audeering.com/上的SIG‘’MM教程)和一个VAD来为某些功能(函数)启用实时输入的分段。

另请查看:How to create custom config files in OpenSMILE,了解如何定制配置文件并正确设置缓冲区大小(在实时模式下,使用环形缓冲区以避免不断增长的内存消耗非常重要)。

票数 1
EN

Stack Overflow用户

发布于 2015-07-24 15:14:32

如果您使用portAudio构建openSMILE,它将正常工作:)

根据手册:

..。提供了一个实时特征提取示例,捕获实时音频并从输入中提取韵律特征(基音和响度轮廓)。要素将保存到CSV le。要使用此聚集,请键入以下内容:

SMILExtract -C配置/liveProsodyAcf.conf

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21118235

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档