首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Azure对话转录:用户as以$ref$的形式出现

Azure对话转录:用户as以$ref$的形式出现
EN

Stack Overflow用户
提问于 2019-08-22 21:58:35
回答 1查看 226关注 0票数 0

我正在使用Microsoft speech SDK (和他们的示例代码)转录一个多参与者对话。转录运行良好,但对于具有提供签名的人员,它将返回$ref$而不是userid;对于没有签名的人员,它将返回Unidentified

我使用的不是Roobo,而是我用Audacity准备的一个声音文件,它是8声道的16位16 kHz PCM音频。转录可以工作,所以我认为声音文件不是问题所在。该服务似乎正确识别了与签名文件绑定的语音(例如,它在文本中的正确位置从$ref$切换到Unknown ),但似乎无法访问扬声器名称(模型中的用户It )。

不幸的是,除了提供的微软示例(https://docs.microsoft.com/bs-latn-ba/azure/cognitive-services/speech-service/how-to-use-conversation-transcription-service)之外,我在网上找不到任何C#代码可供参考。

我看到这里有一个类似的问题(但没有答案)的帖子:Azure Speech To Text: Conversation Transcribing userid always return $ref$

有没有人尝试过这一点并付诸实施?

EN

回答 1

Stack Overflow用户

发布于 2019-12-06 19:01:16

似乎音频的格式不正确。应为16bit、16kHZ、8声道(立体声Left=1、立体声Right=2、Mono=3、Mono=4、Mono=5、Mono=6、Mono=7、静音Mono=8)。

你可以找到enrollment_audio_steve.wav,enrollment_audio_katie.wav Here conversation katiesteve.wav。它的格式是正确的。但是,它不允许从enrollment_audio_katie.wav创建签名。所以这对史蒂夫来说是可行的。

它似乎仍然只适用于SpeechSDK设备。但我可以重新录制自己的音频,基于这种格式。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57611079

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档