搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏pyvoip
FreeSWITCH对接vosk实现实时语音识别
，今天记录下FreeSWITCH对接vosk实现实时语音识别。 vosk离线语音识别可参考我之前写的文章：python使用vosk进行中文语音识别二、具体实现1、编译及安装vosk模块可直接使用github上的代码进行编译：https://github.com/alphacep 模块1）启用 vosk 模块；编辑 autoload_configs/modules.conf.xml 文件，启用 vosk 模块：<load module="mod_<em>vosk</em>"/>2）配置 conf 文件；将 mod_vosk/conf/vosk.conf.xml 配置文件复制到如下路径：/usr/local/freeswitch/conf/autoload_configs/修改 vosk 服务器地址：图片三、运行效果1、启动 vosk 服务器目录：vosk-server\websocket启动命令如下：workon py39envpython asr_server.py vosk-model-cn
7.5K51编辑于 2023-05-04
来自专栏Rust语言学习交流
【Rust日报】2022-07-04 使用 Diesel 和 PostgreSQL 创建 Rust API
github 数据指标等如何快速的启动 axum 服务性能测试对比原文链接：https://tech.marksblogg.com/axum-rust-web-framework.html vosk-rs : Vosk 的 Rust binding Vosk 是一个语言识工具包, 支持 20 多种语言, 可以在 raspberry Pi, Android, iOS 上等脱机使用. vosk-rs 是他的一个 Vosk介绍地址：https://alphacephei.com/vosk/index.zh github地址：https://github.com/Bear-03/vosk-rs -- From 日报小组
84720编辑于 2022-11-28
Failed to unpack the model Failed to create a model"
✅ 解决方案✅ 方法 1：下载官方支持的 Vosk Android 模型（推荐）去 Vosk 官网模型页面下载适用于移动端的中文模型，比如： vosk-model-small-cn-0.22.zip（步骤：下载 vosk-model-small-cn-0.22.zip。解压后放到 assets/vosk-model-cn/ 目录下。解压后结构类似： assets/└── vosk-model-cn/ ├── README ├── conf/ ├── final.mdl ├── words.txt ├─ 保持你的代码逻辑不变即可： StorageService.unpack(this, "vosk-model-cn", "model", (model) -> { this.model
38210编辑于 2025-08-23
来自专栏FreeSWITCH中文社区
如何使用XSwitch内置的离线ASR及TTS
使用开源的Vosk引擎。Vosk引擎比较小，但是模型文件比较大，因而需要单独下载。首先，进入宿主机上的storage目录，创建vosk目录，如下： cd storagemkdir vosk 到以下地址下载模型文件，解压后放到刚刚创建的vosk目录。 https://alphacephei.com/vosk/models 目前测试了以下几个模型： vosk-model-cn-0.1 8k vosk-model-small-cn-0.3 16k vosk-model-small-en-us 上述命令中，也可以通过asr:ai:vosk-model-cn-0.1指定使用的模型。使用AI模块，8k语音模型asr:ai:vosk-model-cn-0.1 # 使用AI模块，FreeSWITCH兼容模式，8k语音模型 XCC中，不需要asr:前缀，用起来更高效。
3.5K20编辑于 2022-12-12
来自专栏AI SPPECH
AI的倾听艺术与语音交互温度教学——从语料清洗到唤醒响应的系统实践
二、核心代码（可运行示例） # 运行前：确保已安装 requirements.txt 中的 vosk、sounddevice、numpy、pyttsx3 # 并将中文模型下载到 . /models/vosk-cn-small 目录（README 有说明） import sounddevice as sd import numpy as np import json from vosk API集成：FastAPI 提供本地 TTS 服务，其他脚本（如 Azure/Vosk 助手）通过 HTTP 调用。 ', 'models', 'vosk-cn-small') assert os.path.exists(MODEL_DIR), f"Vosk模型未找到：{MODEL_DIR}" model = Model Vosk模型路径错误：确认 models/vosk-cn-small 目录存在且含 conf、am 等子目录。
32310编辑于 2025-11-16
来自专栏FreeSWITCH中文社区
如何使用Portainer实现XSwitch Docker可视化管理
freeswitch/log - /data/storage/upload:/usr/local/freeswitch/storage/upload - /data/storage/vosk :/usr/local/freeswitch/storage/vosk - /data/storage:/usr/local/freeswitch/storage - /data
74120编辑于 2024-03-06
来自专栏程序员
从理论到实践：构建你的AI语音桌面助手（Demo演示）
表1：Demo技术栈选型与说明模块推荐技术/库作用备注语音识别(STT)SpeechRecognition+PyAudio录制麦克风音频并转换为文本基础易用，可使用离线的Vosk引擎替换以获得更好隐私性提升语音交互体验（改进“口”）：使用离线STT/TTS引擎（如Vosk和Piper）以获得更快的响应和绝对的隐私。实现“HeyAssistant”这样的免唤醒词热词检测，让交互更自然。
59700编辑于 2025-12-01
来自专栏公共互联网反网络钓鱼（APCN）
AI语音变声技术驱动下的Vishing攻击演化与防御机制研究
：LibriSpeech（clean）、Tedlium、SPGISpeech；ASR模型：DeepSpeech（Mozilla）、Wav2Vec2（Facebook）、Whisper（OpenAI）、Vosk WEREchoGuard WERΔWERMOSDeepSpeech8.2%42.7%+34.5%4.3Wav2Vec25.1%38.9%+33.8%4.4Whisper (base)4.3%18.6%+14.3%4.5Vosk9.7%
52010编辑于 2025-11-25
一键搞定人脸识别、语音识别、车牌识别本地化！离线跑模型不装框架！！！
语音识别（ASR）：Whisper+Vosk+sherpa-onnx组合拳SmartJavaAI的语音识别模块集成了多款成熟开源项目：Whisper：OpenAI的通用语音识别模型，支持多语言转写与翻译 Vosk：轻量级离线ASR，适合低资源设备和实时场景。sherpa-onnx：基于ONNXRuntime的ASR/TTS推理框架。语音与会议场景通过ASR（Whisper/Vosk/sherpa-onnx）+TTS，可以支持会议转写、语音助手、语音导航等功能；实时语音识别能力也适合在客服热线、语音机器人等场景中使用。
69911编辑于 2025-11-28
来自专栏AI
AI英语口语陪练APP的开发
发音评估模块：通过声学模型（如Kaldi、Vosk）分析用户发音的音素准确度（如/θ/与/s/区分）、语调自然度（重音/连读），对比标准发音生成评分（如90/100）。
61110编辑于 2025-09-18
来自专栏GPUS开发者
如何在 NVIDIA Jetson 开发板上运行类似 ChatGPT 的 LLM
项目整合对于这个项目，我使用 Vosk API 集成了唤醒词检测和自动语音识别。然后，使用了 Piper 文本转语音组件。
1.8K20编辑于 2023-07-08
来自专栏个人路线
打造鸿蒙三方库生态新基石：从适配共建到生态繁荣
libdeflate libdeflate C 18 https://github.com/felipensp/libvm libvm C 19 https://github.com/alphacep/vosk-api vosk-api C++ 20 https://github.com/stac47/libuseless libuseless C++ 21 https://github.com/ropensci
70420编辑于 2025-09-03
来自专栏深度学习与python
正确复制、重写别人的代码，不算抄袭
个依赖关系的需求，最后得到了如下结果：有一个名为“microphone-stream”的 NPM 包，我在 Web 应用中使用它来发送从麦克风捕获的样本缓冲区到语音识别包（Cieran O'Reilly 的 vosk-browser
2K20编辑于 2023-03-29
来自专栏网络安全攻防
应急响应记录之水坑挂马事件分析
BXDCSiCTVDpNCDM6vUHAEMMERAhijLaFEwX2QF7eTEFibwRash5NDCqxMPcRTGhWp865Xs7iry1VfD6yik6aQ8IIEty7GEF6EwUkQRJoxhwDLS5LxFBMsskyNfff01NDBDj6VDC448/9DqAw8wzbBBShSuRE9QSym1lVRraZ/IGkQeOdYi7+orfz9hkYFBBRvYsibPWLGE2Vosk8UyBqRuQM2pEzGdGWbQDZfdgOFdXsUK8 BXDCSiCTVDpNCDM6vUHAEMMERAhijLaFEwX2QF7eTEFibwRash5NDCqxMPcRTGhWp865Xs7iry1VfD6yik6aQ8IIEty7GEF6EwUkQRJoxhwDLS5LxFBMsskyNfff01NDBDj6VDC448/9DqAw8wzbBBShSuRE9QSym1lVRraZ/IGkQeOdYi7+orfz9hkYFBBRvYsibPWLGE2Vosk8UyBqRuQM2pEzGdGWbQDZfdgOFdXsUK8
37110编辑于 2024-12-23

FreeSWITCH对接vosk实现实时语音识别

【Rust日报】2022-07-04 使用 Diesel 和 PostgreSQL 创建 Rust API

Failed to unpack the model Failed to create a model"

如何使用XSwitch内置的离线ASR及TTS

AI的倾听艺术与语音交互温度教学——从语料清洗到唤醒响应的系统实践

如何使用Portainer实现XSwitch Docker可视化管理

从理论到实践：构建你的AI语音桌面助手（Demo演示）

AI语音变声技术驱动下的Vishing攻击演化与防御机制研究

一键搞定人脸识别、语音识别、车牌识别本地化！离线跑模型不装框架！！！

AI英语口语陪练APP的开发

如何在 NVIDIA Jetson 开发板上运行类似 ChatGPT 的 LLM

打造鸿蒙三方库生态新基石：从适配共建到生态繁荣

正确复制、重写别人的代码，不算抄袭

应急响应记录之水坑挂马事件分析

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐