搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏CSDN博客
FunASR语音识别GUI界面应用
前言本文将介绍一个基于FunASR开发的语音识别界面应用，这个应用可以选择本地音频，也可以录音识别。支持多种音频格式和视频格式，可以对识别的结果加上时间戳做成字幕。
2.3K40编辑于 2023-10-09
基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现
【框架地址】 https://github.com/modelscope/FunASR 【简单介绍】 FunASR是一个功能全面的语音识别工具包，支持多种预训练模型的推理和微调，提供高精度和高效能的语音识别服务随后，使用FunASR中的实时语音识别模型（如Paraformer-zh-streaming）对预处理后的音频数据进行处理。这些模型能够实时地将音频数据转换为文本信息，支持中文等多语言识别。在识别过程中，FunASR还提供了语音端点检测（VAD）功能，自动检测语音片段的开始和结束，以提高识别效率。同时，还可以添加标点恢复（PR）功能，为识别结果添加标点符号，提升可读性。【测试环境】 anaconda3+python3.9 torch==2.0.1+cu117 funasr==1.1.4 modelscope==1.16.1 PyAudio ==0.2.14 【调用代码 from FunasrManager import * fm = FunasrManager() fm.start() while True: time.sleep(0.2) 【视频演示】基于funasr
1.3K10编辑于 2025-07-21
FunASR：几行代码搞定语音识别全流程的开源工具包，GitHub已获15.2k Star！
本文将从项目定位、模型体系、使用方式和服务部署几个方面，对 FunASR 做一个全面的介绍。一、FunASR 是什么？ FunASR 的核心价值在于工具包能力——统一的 AutoModel 接口、灵活的模型组合、一键服务部署。二、核心模型一览FunASR 的模型库覆盖了语音处理的多个环节。这种模型组合能力是 FunASR 作为工具包的核心优势。需要在特定领域微调的团队：FunASR 支持在预训练模型基础上进行微调，适配垂直行业的专业词汇和口音。
2.4K41编辑于 2026-03-17
中文语音识别该用谁？6 个开源模型 + 2 个配套工具，一文理清
Qwen3-ASR 和 Moonshine 是独立接口，不通过 FunASR 调用。七、上手使用：从代码开始 FunASR 工具包（Paraformer / SenseVoice / Fun-ASR-Nano 通用）安装一行搞定： pip3 install -U funasr FunASR 需要实时/流式转录Paraformer-streaming（通过 FunASR）、Fun-ASR-Nano（通过 FunASR）、Qwen3-ASR 或 Moonshine，均原生支持流式识别。不知道选什么从 FunASR 开始。相关仓库： FunASR：https://github.com/modelscope/FunASR （15.2k Star） SenseVoice：https://github.com/FunAudioLLM
2.7K10编辑于 2026-03-20
来自专栏AI软件
麦克风和电脑内播放声音实时识别转文字软件FunASR整合包V5下载
我基于FunASR制作的实时语音识别转文字软件当前更新到V5版本。软件可以实时识别麦克风声音和电脑内播放声音转为文字。下载链接在文章末尾FunASR软件介绍FunASR 是一款基础语音识别工具包和开源 SOTA 预训练模型，支持语音识别、语音活动检测、文本后处理等。我使用FunASR制作了一款实时语音识别转文字软件，当前版本为V4版本，由于前几天分享过另一个音视频识别转文字软件faster-whisper《音频视频转文字软件faster-whisper 1.1.1 FunASR在2月5日刚更新过，我基于最新版制作了当前版本实时语音识别软件整合包如果需要同时有识别文件和实时识别功能的话，请用V3版本，链接《实时语音识别转文字软件V3版，批量音频视频录音转文字提取工具》FunASR实时语音识别整合包V5软件使用说明软件下载解压后直接双击【启动软件.exe】即可启动。
1.2K00编辑于 2025-06-02
来自专栏开源服务指南
Cypress.io：快速简单可靠的浏览器测试工具 | 开源日报 No.142
成本低廉且易获得组件（<15€）可以使用 3D 打印的 snap-fit 外壳在输出端实现完全电气隔离兼容 Linux、macOS 和 Windows 操作系统 alibaba-damo-academy/FunASR [3] Stars: 2.0k License: NOASSERTION FunASR 是一个基础的语音识别工具包，提供了多种功能，包括语音识别（ASR）、语音活动检测（VAD）、标点还原、语言模型、 cypress-io/cypress [2] hrvach/deskhop: https://github.com/hrvach/deskhop [3] alibaba-damo-academy/FunASR : https://github.com/alibaba-damo-academy/FunASR [4] iusztinpaul/hands-on-llms: https://github.com/iusztinpaul
55110编辑于 2024-01-03
来自专栏Datawhale专栏
深度剖析AI机会，数字人智能对话系统：未来的人机交互新范式
参考地址： Whisper： https://github.com/openai/whisper FunASR： https://github.com/alibaba-damo-academy/FunASR 我们也可以使用 Whisper 模型或 FunASR 模型来搭建自己的智能语音助手。 Whisper 和 FunASR 都提供了良好的 API 接口，使我们能够快速搭建系统。以下是关于 Whisper 和 FunASR 的两个演示，只需安装相应的环境，即可快速使用这些强大的开源语音识别模型。 ''' Reference: https://github.com/alibaba-damo-academy/FunASR pip install funasr pip install modelscope pip install -U rotary_embedding_torch ''' from funasr import AutoModel class FunASR: def __init_
2.5K11编辑于 2024-06-19
来自专栏翩翩白衣少年
『GitHub项目圈选22』推荐5款深受好评的AI开源项目
该工具使用了阿里巴巴语音识别模型 FunASR Paraformer-Large 确保了剪辑的精准性。你可以根据识别结果选择文本片段或说话人进行视频裁剪。这样的方式使得视频剪辑变得非常方便。 1.2k 项目地址：https://github.com/alibaba-damo-academy/FunClip 魔搭平台体验地址：https://modelscope.cn/studios/iic/funasr_app_clipvideo /summary 主要功能特征： • 高精度语音识别：采用阿里巴巴语音识别模型 FunASR Paraformer-Large 确保了剪辑的精准性。
1.4K11编辑于 2024-05-14
牛！达摩院孵化开源项目，让数字人"活"起来：OpenAvatarChat教你轻松搭建自己的数字人
数字人表情驱动轻量化本地部署硬件配置运行效果i5 CPU+8G内存基础版对话（纯文字）GTX1060显卡流畅语音+基础表情RTX3060显卡4K级数字人+实时表情反馈智能语音管家# 语音交互配置示例（config.toml）[ASR_Funasr 支持定制专属声线跨场景应用支持在线教育：AI老师自动批改作业智能客服：7x24小时情绪稳定的服务代表虚拟主播：直播间永不疲倦的带货达人医疗陪护：记忆超群的健康管家项目效果技术架构解密模块技术方案性能指标语音识别FunASR
4.9K10编辑于 2025-04-28
来自专栏开源服务指南
搞定语音识别，畅享高效处理 | 开源专题 No.78
alibaba-damo-academy/FunASRhttps://github.com/alibaba-damo-academy/FunASR Stars: 2.0k License: NOASSERTION FunASR 是一个基础的语音识别工具包，提供了多种功能，包括语音识别（ASR）、语音活动检测（VAD）、标点还原、语言模型、说话人验证、说话人分离和多讲者 ASR。
99810编辑于 2024-05-17
来自专栏CSDN博客
识别准确率竟如此高，实时语音识别服务
前言本文将介绍一个准确率非常高的语音识别框架，那就是FunASR，这个框架的模型训练数据超过几万个小时，经过测试，准确率非常高。
2.5K30编辑于 2023-10-23
来自专栏开源服务指南
精准视频切片与 AI 智能剪辑工具 | 开源日报 No.311
该项目的主要功能、关键特性和核心优势包括：使用阿里巴巴通义实验室开源的 FunASR Paraformer 系列模型进行视频语音识别。
1.5K10编辑于 2024-07-31
Wispr Flow 平替, 这款开源中文语音助手，程序员真该试试,本地离线的中文语音输入神器来了（开源白嫖版）
实时识别+自动粘贴：本地FunASR实时转写，等AI处理完文本，会自动粘贴到你当前光标所在位置，感觉像多了个“语音键盘”。
94710编辑于 2025-12-23
来自专栏CSDN博客
实时指令唤醒
在根目录的models目录下，复制微调后的模型文件夹，并命名为paraformer-large-onnx-finetune，接着执行命令： python -m funasr.export.export_model
48210编辑于 2023-12-18
基于yolov8+lprnet的中文车牌识别系统python源码+pytorch模型+精美GUI界面
OpenCvSharp部署yolov8-pose姿态识别，使用C#部署yolov8的目标检测tensorrt模型，基于C#实现winform版yolov8-onnx+bytetrack目标追踪的算法结果演示，基于funasr
77410编辑于 2025-07-16
来自专栏具身小站
智能语音对话系统技术方案
93–96% 本地部署开源、多语言、中文好实时性一般、算力要求高对数据隐私要求高、自建呼叫中心 SenseVoice ~95% 本地部署阿里开源、中文优化、实时性好生态相对新国内私有化部署 FunASR
20110编辑于 2026-04-14
AI配音新王者！快手AudioGen-Omni：视频喂给它，歌声/语音/音效秒出，唇形精准到帧！
歌词：对于音乐内容，通过 FunASR（一种以中文为核心的强大 ASR 工具包）提取并转录歌词，提供精确的帧级时间戳和标点符号，以促进后续对齐和生成过程。
83710编辑于 2025-08-27
来自专栏java 后台
重塑银幕声音：腾讯云语音在视频中的应用
简单的音频处理可以通过一些低通滤波函数，还可以使用一些开源的语音增强工具，例如：FunASR 是阿里巴巴达摩院开源的语音增强工具，复杂的可能需要使用到 RNN 循环卷积神经网络。
2.7K44编辑于 2024-05-28

FunASR语音识别GUI界面应用

基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现

FunASR：几行代码搞定语音识别全流程的开源工具包，GitHub已获15.2k Star！

中文语音识别该用谁？6 个开源模型 + 2 个配套工具，一文理清

麦克风和电脑内播放声音实时识别转文字软件FunASR整合包V5下载

Cypress.io：快速简单可靠的浏览器测试工具 | 开源日报 No.142

深度剖析AI机会，数字人智能对话系统：未来的人机交互新范式

『GitHub项目圈选22』推荐5款深受好评的AI开源项目

牛！达摩院孵化开源项目，让数字人"活"起来：OpenAvatarChat教你轻松搭建自己的数字人

搞定语音识别，畅享高效处理 | 开源专题 No.78

识别准确率竟如此高，实时语音识别服务

精准视频切片与 AI 智能剪辑工具 | 开源日报 No.311

Wispr Flow 平替, 这款开源中文语音助手，程序员真该试试,本地离线的中文语音输入神器来了（开源白嫖版）

实时指令唤醒

基于yolov8+lprnet的中文车牌识别系统python源码+pytorch模型+精美GUI界面

智能语音对话系统技术方案

AI配音新王者！快手AudioGen-Omni：视频喂给它，歌声/语音/音效秒出，唇形精准到帧！

重塑银幕声音：腾讯云语音在视频中的应用

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

FunASR语音识别GUI界面应用

基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现

FunASR：几行代码搞定语音识别全流程的开源工具包，GitHub已获15.2k Star！

中文语音识别该用谁？6 个开源模型 + 2 个配套工具，一文理清

麦克风和电脑内播放声音实时识别转文字软件FunASR整合包V5下载

Cypress.io：快速简单可靠的浏览器测试工具 | 开源日报 No.142

深度剖析AI机会，数字人智能对话系统：未来的人机交互新范式

『GitHub项目圈选22』推荐5款 深受好评 的AI开源项目

牛！达摩院孵化开源项目，让数字人"活"起来：OpenAvatarChat教你轻松搭建自己的数字人

搞定语音识别，畅享高效处理 | 开源专题 No.78

识别准确率竟如此高，实时语音识别服务

精准视频切片与 AI 智能剪辑工具 | 开源日报 No.311

Wispr Flow 平替, 这款开源中文语音助手，程序员真该试试,本地离线的中文语音输入神器来了（开源白嫖版）

实时指令唤醒

基于yolov8+lprnet的中文车牌识别系统python源码+pytorch模型+精美GUI界面

智能语音对话系统技术方案

AI配音新王者！快手AudioGen-Omni：视频喂给它，歌声/语音/音效秒出，唇形精准到帧！

重塑银幕声音：腾讯云语音在视频中的应用

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

『GitHub项目圈选22』推荐5款深受好评的AI开源项目