如何在不使用显示器的情况下将文本转换为语音,并将文件保存到mp3?(python)
我想将我的音频保存到文件中,但是我不知道我能做什么
完整代码- https://colab.research.google.com/github/d8oss/akeke/blob/main/DeepVoice.ipynb
但我想在我的操作系统上这样做。
(这不是全部代码)
import torch
language = 'ru'
speaker = 'baya_16khz'
device = torch.device('cpu')
model, symbols, sample_rate, example_text, apply_tts = torch.hub.load(repo_or_dir='snakers4/silero-models',
model='silero_tts',
language=language,
speaker=speaker)
model = model.to(device) # gpu or cpu
audio = apply_tts(texts=["Привет как дела"],
model=model,
sample_rate=sample_rate,
symbols=symbols,
device=device)
print(example_text)
display(Audio(audio[0], rate=sample_rate))换句话说-我如何在我的桌面https://colab.research.google.com/github/d8oss/akeke/blob/main/DeepVoice.ipynb上执行这个脚本
发布于 2021-09-12 18:28:23
您可以使用torchaudio来执行以下操作:
import torchaudio从apply_tts获取音频后,使用以下代码将音频保存为MP3:
torchaudio.save(f'test_1.mp3',
audio[0].unsqueeze(0),
sample_rate=16000)https://stackoverflow.com/questions/69153968
复制相似问题