我可以使用OpenSMILE从存储在系统中的音频文件中提取特征。但我需要使用相同的OpenSMILE实时提取特征。有没有可能不保存录制的音频文件?
发布于 2014-01-15 00:21:36
似乎它可能会支持它。从manual
要检查您的SMILExtract二进制文件是否支持实时音频录制和播放,请键入:
SMILExtract -H cPortaudio
和
组件cPortaudioSource和cPortaudioSink可用作cWaveSource和cWaveSink的替代品。它们以与wave组件相同的格式产生/期望数据。
万岁的互联网搜索...
发布于 2017-04-22 17:13:49
您可能还需要一个cTurnDetector组件(请参阅http://opensmile.audeering.com/上的SIG‘’MM教程)和一个VAD来为某些功能(函数)启用实时输入的分段。
另请查看:How to create custom config files in OpenSMILE,了解如何定制配置文件并正确设置缓冲区大小(在实时模式下,使用环形缓冲区以避免不断增长的内存消耗非常重要)。
发布于 2015-07-24 15:14:32
如果您使用portAudio构建openSMILE,它将正常工作:)
根据手册:
..。提供了一个实时特征提取示例,捕获实时音频并从输入中提取韵律特征(基音和响度轮廓)。要素将保存到CSV le。要使用此聚集,请键入以下内容:
SMILExtract -C配置/liveProsodyAcf.conf
https://stackoverflow.com/questions/21118235
复制相似问题