有用卷积神经网络制作音频的方法吗?
利用凸网生成图像有很多种方法。但我没有看到任何关于制作音频的文章或帖子。
根据stackoverflow上的这个主题,这位帖子作者说:
“我发现音频可以用光谱图来表示。”
,那么为什么不能这样做呢?
要使用Convnet执行此操作,应该使用 :吗?
a)在控制层中使用LSTM?
B)输出应该是什么?考虑到镜片..。
发布于 2017-01-24 10:11:43
是的,当然有,Deepmind的WaveNet制作的音频非常类似于“类人”的质量。它也能产生音乐。
https://deepmind.com/blog/wavenet-generative-model-raw-audio/
https://stackoverflow.com/questions/41817828
复制相似问题