我想将文本文件转换为具有以下属性的.wav文件:
音频采样率:8 kHz,音频采样量: 16位,通道:单声道,码率: 128kbps
有没有办法直接用python来做呢?我在谷歌上搜索,发现我们可以将文本转换为mp3,然后从mp3转换为.wav,但我需要将这些属性也包括在内
发布于 2021-06-26 04:34:16
这里需要的是一个文本到语音库或服务,它接收一个文本作为输入,并生成一个带有一些声音的音频文件。
这里有几个选项,其中一个是https://www.geeksforgeeks.org/convert-text-speech-python/,另一个我推荐的是IBM Cloud Watson的https://www.ibm.com/demos/live/tts-demo/self-service/home。
当然,根据所使用的技术和选择的语言,一些语言会比其他语言表现得更好,因为每种语言都有自己的口音。像IBM这样的基于云的游戏可以让你播放一点,但如果你需要生成大量的音频文件,你就必须付费使用它。
https://stackoverflow.com/questions/68136691
复制相似问题