-3"models":[{"provider":"deepgram","model":"nova-3"}]}}}}配置完成后,当用户发送音频文件时,OpenClaw会自动将其发送至Deepgram进行转录 展开代码语言:TXTAI代码解释{"tools":{"media":{"audio":{"enabled":true,"models":[{"provider":"deepgram","model":"nova :true,//自动添加标点符号"smart_format":true//智能格式化(如日期、数字、专有名词)}},"models":[{"provider":"deepgram","model":"nova nova-3是最新的高速高精度模型。languageStringnull语言代码(ISO639-1)。若开启detect_language则此项可选。 六、最佳实践建议首选Nova-3模型:nova-3在速度和准确率之间取得了最佳平衡,特别适合实时交互场景。
上:与自己模型对比;下:与市面其他模型对比 结果很明显,无论是和 Whisper v2/v3 比,还是和 Gemini、scribe-v1、nova-2 & nova-3 这些模型比,gpt-4o-transcribe