我想构建一个带有文本框的应用程序,该应用程序捕获由Dragon Medical Practice Edition 4 (DMPE4)在Windows环境中创建的声音转录。默认情况下,DMPE4会将任何转录到光标当前位置的文本放入其中。这意味着,如果用户点击他们想要口述的地方以外的其他地方,那么语音将被转录到不同的窗口中(或者更糟糕的是,如果没有文本框可用,他们口述的内容将不会出现在任何地方)。
我想要一个具有文本框的WPF应用程序,它将捕获文本,而不管当前光标位置在哪里,它应该将转录的文本放入光标最后所在的文本框中。只要应用程序处于打开状态,包含文本框的窗口处于活动状态,就不可能在其他地方转录文本。我仍然想使用DMPE4应用程序和它的所有其他功能,我只是希望将转录后的文本放入特定的文本框中。
我找到的几个教程都是基于微软内置的语音识别System.Speech的,我想使用DMPE4,但我似乎找不到一个好的起点。
DMPE4有一个类似的东西叫做“听写框”,但是为了把文本从“听写框”转到文本所在的位置,需要额外的步骤,我希望文本直接进入新应用程序的文本框中。
发布于 2021-10-22 14:27:47
我的第一个想法是在虚拟机中运行它(或者像docker这样的容器就足够了),在那里它只会将字符写入你的侦听器应用程序,然后你就可以在其他地方传输和使用它。
然而,如果你只需要创建一个基于Dragon Medical的语音识别的解决方案,我会从他们的软件开发工具包开始,它可以为任何软件提供语音识别功能:https://www.nuance.com/dragon/for-developers/dragon-software-developer-kit.html
https://stackoverflow.com/questions/69442319
复制相似问题