可计算或显示的声音质量有各种定义,包括:
- 比特率--文件格式有多高的清晰度--这很容易从大多数音频格式中提取出来,但也有一些使用可变比特率。
- 位深度--有多少不同的声级可以表示--如果你的声音只能是256个音阶中的一个,那么它显然会比65536个音阶差,等等,也很容易从大多数音频格式中提取出来。
- 频谱宽度--有多宽的频率范围--这是比特率和编码的函数,但是仅仅因为文件是以一种可以有宽频谱的方式编码的,并不一定意味着它的存在--我看到人们使用宽的频谱宽度设置,同时(重新)从一个非常窄的带宽源进行记录。-需要处理记录,用傅里叶变换等方法确定实际光谱。
- Fidelity --记录的准确性--这是上述的函数,包括文件的历史,但只能通过与原始源的比较来衡量,而且常常包括对大多数人来说完全听不见的频率。很难检查,因为您将需要原始比较记录和一个机制,肯定不会引入错误本身。
- 嘶嘶声--当你在一个真正的唱片播放器上播放一张旧唱片时经常听到的声音--有些人喜欢它,很多人讨厌它。通常可以通过寻找整个录音过程中存在的高频噪声来测量嘶嘶声,否则会出现在安静的时段。点击,流行等等,也可以使用工具,如傅里叶变换。
- 背景噪音--有些录音包含不打算被记录的声音--要自动识别要困难得多。
- 录音是多么令人愉快--纯粹是主观的和个人的,你可以训练一个神经网络,给它1000 s的录音和每个记录的评级,但它可能会有一个低的准确性。
有许多工具可以执行音频质量评估中可量化的部分,我建议您看看奥比奥,它是一个免费的开放源码库,有一些命令行工具,可以为您提供频率范围、噪声和嘶嘶级别等的测量值。
我还建议看看https://dsp.stackexchange.com/,看看其他的洞察力和工具。