采样率或帧率是声音每秒采样的次数。通道数表明音频是单声道,立体声还是四路。每个帧每个通道包含一个采样。样本大小是每个样本的大小(以字节为单位)。
采样率默认为16,000,但只要所有音频始终保持相同的速率(该脚本不支持重新采样),您可以使用--sample_rate参数更改此参数。剪辑也应该大致相同。
我们发现,当使用大输入和每秒更高采样率处理时,使用tf.FIFOQueue并tf.train.queue_runner不能饱和多个当代GPU,例如使用AlexNet训练ImageNet。

扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2026 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059
粤公网安备44030502008569号
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号
