我使用Google的例子实现音素,如下所示:
<phoneme alphabet="ipa" ph="təmei̥ɾou̥"> tomato </phoneme>我使用Postman将请求作为POST发送到https://texttospeech.googleapis.com/v1/text端点。
我注意到,如果我更改单词“西红柿”,但保留"ph“的原始值,语音音频仍然完全返回单词”西红柿“。我本以为语音音频会返回到“只”声音。
<phoneme alphabet="ipa" ph="tə"> tomato </phoneme>通过Postman发送JSON格式的POST请求时,我总是转义引号以避免JSON解析错误:
{
"audioConfig":{
"audioEncoding":"LINEAR16",
"volumeGainDb":"16",
"pitch": 0,
"speakingRate": 1
},
"input":{
"ssml":"<speak><phoneme alphabet=\"ipa\" ph=\"tə\"> tomato </phoneme></speak>"
},
"voice":{
"languageCode":"en-US",
"name":"en-US-Wavenet-F",
"ssmlGender":"FEMALE"
}
}有人知道为什么音素看起来不起作用吗?
提前谢谢。
发布于 2020-06-09 19:11:03
Google Cloud Speech-to-Text只支持语音合成标记语言标记的一个子集,不幸的是,<phoneme>目前不是其中之一。
您可以找到哪些是受支持的here。
发布于 2021-09-29 10:19:17
在2020年提出这个问题时,音素不受支持,但现在是在2021年。请参阅this answer以获取一些需要查找的陷阱。
https://stackoverflow.com/questions/62219880
复制相似问题