在为一个哑巴用户生成的符号视频中看到的模式选择正确的分类技术时,我感到非常困惑。我了解到神经网络( NN )在几个方面比隐马尔可夫模型更好,但微调神经网络的参数需要大量的时间。我应该在这些选择中选择什么,或者有没有其他更好的选择,这样我就可以在4-5个月内完成我的项目,并且我可以继续在我的硕士课程中学习这个领域?
这里我的谷歌语音设置给AI发短信以下是语音到文本AI:的输出文件这是视频链接:例如
Google文字演讲: Represent the **doctor** representation is one of the hardest part of computer AIYouTube的自动字幕: represent the **data** representation is one of
我有一个项目,使用Azure Media Services广播视频流,当广播结束时,它将生成的资产提供给,从中提取洞察力。问题是,它完美地生成了所有的洞察力数据,但是转录(从语音到文本)只工作10分钟。" ]广播在我的站点嵌入的AMS播放器中正确显示,如果我下载广播文件并使用试用帐户将其上传到videoindexer.ai,它将生成整个视频的记录记录OK。视频索引选项在那里,但我