文章/答案/技术大牛

发布

社区首页 >问答首页 >Azure的TTS语音速率和音高是否在后处理中完成？

问Azure的TTS语音速率和音高是否在后处理中完成？
EN

Stack Overflow用户

提问于 2022-09-21 15:07:33

回答 1查看 47关注 0票数 0

我正在使用Azure的TTS服务，并且想知道在生成基本声音之后，速率和音调值是否应用于音频文件，还是它们是产生基本声音的AI算法的一部分？

我想知道上面的情况，因为它会影响对生成文件的采样(和可用声音)的选择。例如，如果我在24 the处生成一个声音文件，然后根据设置(速率、音高)进行拉伸，那么与在48 the产生的声音文件相比，会有一些质量损失，然后再进行后处理。然而，如果速度和音高是AI算法的一部分，那么声音就不会受到高质量的影响。

这也很重要，因为如果声音是在后期处理的，我可以在DAW中以更高的精度完成这个任务，而不是依赖于TTS进程中的设置。但是，如果algo根据TTS中的设置修改声音，那么质量将尽可能好。

text-to-speech

azure-cognitive-services

回答 1

Stack Overflow用户

发布于 2022-09-27 09:41:15

有两种方法可以执行这些操作：

创建自定义语音

开放式演讲演播室

b.录制音频

c.执行语音合成器

若要获得访问权限，请单击“应用访问”。您的组织管理员将根据请求给予您访问权限。

要获得操作的完整结构，请检查注释部分中提到的链接。

若要执行编程方式，请按照以下代码块并替换订阅和区域详细信息。

import azure.cognitiveservices.speech as speechsdk


def recognize_from_mic():
    # Find your key and resource region under the 'Keys and Endpoint' tab in your Speech resource in Azure Portal
    # Remember to delete the brackets <> when pasting your key and region!
    speech_config = speechsdk.SpeechConfig(subscription="", region="westus2")
    speech_recognizer = speechsdk.SpeechRecognizer(speech_config=speech_config)

    # Asks user for mic input and prints transcription result on screen
    print("Speak into your microphone.")
    result = speech_recognizer.recognize_once_async().get()
    print(result.text)


recognize_from_mic()

利用语音合成标记语言对合成进行改进。使用以下XML代码创建用于语音合成的XML文件。

<speak version="1.0" xmlns="URL" xml:lang="string"></speak>

若要为文本语音选择语音，请按照注释中提到的链接进行操作。要调整语音补丁和样式，请按照注释中提到的链接构建XML。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/73803114

复制

相似问题

问Azure的TTS语音速率和音高是否在后处理中完成？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Azure的TTS语音速率和音高是否在后处理中完成？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Azure的TTS语音速率和音高是否在后处理中完成？
EN