搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

用vosk api和PyInstaller编译文件

我试着用vosk库把python文件编译成exe文件。编译正常。每次我尝试运行exe时，都会得到这个错误： Traceback (most recent call last): from vosk_load_unlocked File "vosk</e

浏览 123提问于2021-06-27得票数 0

1回答

Vosk (Kaldi)统一离线语音识别

如何在统一项目中实现和使用Vosk库？请写出步骤1，2，3.这里的Vosk库-

浏览 11提问于2020-08-14得票数 2

回答已采纳

1回答

Vosk说话人识别

0.9705387223260904, 0.9077720598812595, 0.9524431272217568, 0.9179475137290445] 如果没有有效的方法从正在分析的音频中计算参考扬声器，您是否知道可以与Vosk

浏览 6提问于2021-05-04得票数 0

1回答

每个转录都需要重新加载vosk模型吗？

我使用的vosk模型是vosk模型-en-us-aspire-0.2 (1.4GB)。每次加载vosk模型都需要相当长的时间。是否有必要每次都重新创建vosk对象？

浏览 10修改于2021-01-17得票数 1

1回答

VOSK空文本输出？(Java)

当我试图从下面的代码获得输出时，提供了通过RecordRTC从客户端传输到服务器的Wave文件的文本文件， InputStream ais = AudioSystem.getAudioInputStream(new BufferedInputStream(new FileInputStream(filepath))); Recognizer recognizer = ne

浏览 3提问于2021-10-24得票数 2

1回答

安装alphacep(VOSK* APİ) Python*

纪念。我我在试着设置它，但是我不能，以前有人能设置它吗？

浏览 5修改于2020-05-20得票数 1

1回答

无法运行.c，因为使用vosk时出现分段故障

问题是python脚本(它是应用程序接口的标准)运行起来没有任何问题，但在用make编译了名为test_vosk.c的.c文件后，他们提供了(所以我没有写它)来运行应用程序接口： } vosk_recognizer_free(recognizer/test_vosk_speaker的错误

浏览 27修改于2021-07-16得票数 0

1回答

如何获取ASR VOSK的详细信息

我与Vosk一起工作，我需要获取中每个单词的时间--这是我的代码 model = Model(model_name="vosk-model-fa

浏览 12提问于2022-11-16得票数 0

1回答

Vosk给出错误ModuleNotFoundError:没有名为“_cffi_backend”的模块

基本上，我在Python中有一个语音识别软件，它完美无缺地工作，然后我的驱动器失效了，我不得不购买一个新的，重新安装Windows，重新安装Python (相同版本)，以及pip install voskimport SetLogLevel as vosk_log_level File "C:\Users\james\AppData\Local\Programs\Python\Python310\lib\site-packages\vosk\__init__.py", line 4, in <module>

浏览 8提问于2022-03-17得票数 0

1回答

创建特定于项目的Vosk字典

我正在开发一个使用Vosk进行语音识别的应用程序。我想为应用程序创建一个字典，它只包含应用程序所需的触发词和口头数字。使用这里找到的命令行说明：我能够在我的笔记本电脑上安装Kaldi。在我的Vosk项目中，我找到了/models，但也没有/model目录。我尝试在/kaldi/tools中创建/model，然后运行上述命令，但没有成功。请让我知道我在这里错过了什么。提前谢谢。

浏览 15修改于2021-06-11得票数 0

1回答

如何在VOSK中实现多语言模型？

我想知道如何使用Vosk库在应用程序中实现多语言处理。我想做一个应用程序，支持多种语言，如波斯语，库尔德语和英语。我想使用的编程语言是带有Spring框架的Java。

浏览 26提问于2022-01-29得票数 2

1回答

是否有可能用Vosk来获得音素的时间，而不是完整的单词？

Vosk很好地输出单词的时间，但是对于单词中的音节/音素，Vosk是否有一种选择或技术来将输出与那些分开呢？

浏览 1提问于2021-09-15得票数 1

1回答

如何在VOSK语音识别中使用Wave文件作为输入？

randomfrom difflib import SequenceMatcherimport sounddevice as sd print("Please download a model for your language from https://alphacephei.com/voskprovides a float: args.samplerate

浏览 64提问于2021-06-29得票数 1

1回答

用于语音识别的Vosk-api python。类似谷歌的语音改编功能？

因此，Vosk-api是一个出色的离线语音识别器，它提供了出色的支持，但是在这篇文章(2020年8月14日)中，文档非常糟糕(或者隐藏得非常巧妙)。我知道它可能不是在Vosk中为python3实现的，但是. 以下是参考资料：

浏览 2提问于2020-08-14得票数 4

回答已采纳

1回答

使用java中的麦克风与VOSK进行语音识别

通过一些谷歌搜索和尝试其他解决方案，我决定使用VOSK进行语音识别。然而，我遇到的主要问题是，VOSK的文档非常少，并且只提供了一个java示例文件，用于从预先录制的wav文件中提取文本，如下所示。{ } } 这似乎正确地捕获了麦克风数据(因为它还输出到扬声器)，但VOSK

浏览 352提问于2021-07-16得票数 2

回答已采纳

1回答

python中的vosk* :获取音频文件中转录文本的位置*

使用一个与Vosk存储库中的test_ffmpeg.py非常相似的文件，我正在探索从音频文件中可以获得哪些文本信息。下面是我正在使用的整个脚本的代码。 #!/usr/bin/env python3 import sysimportif not os.path.exists("model"): print ("Please download the model f

浏览 145提问于2021-10-11得票数 2

1回答

vosk翻译输出仅显示最后一批翻译。

当我试图使用我自己的音频文件运行test_ffmpeg.py时，它实际上并没有显示所有的翻译。但它只显示了最后一段/批。比如，我的音频文件是这样的：The quick brown fox jumps over the lazy catThe quick brown fox jumps over the lazy bat 会发生的是，它会闪现所有这些文本，它们看起来像预期的那样被翻译出来，但是在脚本的末尾，它只显示了，

浏览 2提问于2020-12-07得票数 0

回答已采纳

1回答

在Android上运行Vosk* (Kaldi)提高语音识别精度*

我正在开发一个应用程序来收集在Android设备上使用语音识别的数据。有五个“目标词”，以及几个被识别的数字(0，1，10,100等)。 public void parseWords() { List<String> szlNumbers = Arrays.asList(new String[]{"ONE", "TEN", "ONE HUNDRED", "ONE THOUSA

浏览 16修改于2022-01-06得票数 0

1回答

我正在使用react本机-vosk软件包进行语音识别，但是如何在后台运行它来不断地听。

我正在使用这个pacakge‘run原生-vosk’，但问题是我不能在后台运行这个侦听器。

浏览 8提问于2022-10-23得票数 0

1回答

我应该把VOSK语音识别的模型文件放在哪里？错误(VoskAPI:Model():model.cc:122)

我试过使用VOSK，但得到了以下错误： ERROR (VoskAPI:Model():model.cc:122) Folder 'fa' does not contain model files.

浏览 3提问于2021-10-24得票数 2

回答已采纳

第 2 页第 3 页

点击加载更多

用vosk api和PyInstaller编译文件

Vosk (Kaldi)统一离线语音识别

Vosk说话人识别

每个转录都需要重新加载vosk模型吗？

VOSK空文本输出？(Java)

安装alphacep(VOSK* APİ) Python*

无法运行.c，因为使用vosk时出现分段故障

如何获取ASR VOSK的详细信息

Vosk给出错误ModuleNotFoundError:没有名为“_cffi_backend”的模块

创建特定于项目的Vosk字典

如何在VOSK中实现多语言模型？

是否有可能用Vosk来获得音素的时间，而不是完整的单词？

如何在VOSK语音识别中使用Wave文件作为输入？

用于语音识别的Vosk-api python。类似谷歌的语音改编功能？

使用java中的麦克风与VOSK进行语音识别

python中的vosk* :获取音频文件中转录文本的位置*

vosk翻译输出仅显示最后一批翻译。

在Android上运行Vosk* (Kaldi)提高语音识别精度*

我正在使用react本机-vosk软件包进行语音识别，但是如何在后台运行它来不断地听。

我应该把VOSK语音识别的模型文件放在哪里？错误(VoskAPI:Model():model.cc:122)

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐