我对音频文件进行了快速傅立叶变换,显示了播放音频文件时传播的频率。
有没有一种科学的方法来根据频率分布快照或一系列快照来发现情绪,比如欣喜/悲伤/忧郁?
我的想法是:
极大值个数高于某一阈值,约占最高点的20%,大于或小于某一值,则会导致兴奋或不兴奋。该理论认为,令人愉悦的音乐部分通常伴随着许多和弦/不同的乐器,因此当同时演奏许多不同的频率时,它很可能是令人愉悦的。
不过,还是有很多误报。
发布于 2013-10-23 22:15:57
你观察波峰与背景的强度会告诉你音乐有多“嘈杂”与“音调”,这可能会告诉你它是多么的器乐与打击乐,尽管这项技术可能会将打击乐误解为其他类型的噪音,如环境/环境噪声和声音效果。我不认为这会给你带来太多好处。
从FFT中,你还可以得到其他参数,如光谱质心,这与我们对亮度的感知密切相关,等等。
然而,单凭FFT并不能捕捉到我们所说的音乐的“情绪”或“情感内容”。一些未捕获的信息示例:
音乐的主调。仅仅因为一首歌是一个小调并不能使它变得“悲伤”,但它在song.
发布于 2013-10-23 10:31:57
你可以在谷歌上做更多的研究,但不仅仅是频率能告诉你音乐的情绪,还有很多factor
根据上述因素,你可以设置音乐的特定情绪,
节拍很慢,但音符的频率很高,这可能会强调一种非常深的悲伤。
你可以在互联网上查找不同的音乐moods,然后确定它们的节奏,频率,音符,音色,它们的模式将与特定类型的音乐相匹配。你可以使用神经网络来熟悉你的系统,根据你所研究的模式来确定声音的情绪。
https://stackoverflow.com/questions/19531169
复制相似问题