我喜欢Google Speech to Text API的一点是,它有惊人的准确性,在我的经验中比Azure API要好得多。原因是,我能够在我的请求中向Google API发送一个预期单词的列表,因此,增加了这些术语/短语出现的可能性。使用Azure,我只能创建语音模型。这样做的问题是,我必须为每个请求创建一个新模型,因为每个请求将具有与其他请求不同的词汇表等。这些请求不是特定于行业的,它们完全是随机的。
所以,我的问题是,我可以向Azure API发送我的请求中预期单词的列表吗?
干杯
发布于 2019-11-08 00:08:32
你的问题解决了吗?
关于Azure,您需要首先收集与您的问题和行业相关的培训数据。然后在此数据集上训练一个模型,并在生产中使用此模型转录您的音频。
你不会在每次有新的请求时都训练一个模型。
https://stackoverflow.com/questions/50457553
复制相似问题