
不用显卡 不用折腾环境 不用充会员 视频一拖,字幕直接出
一小时会议录音, 手动整理——半天没了。
视频剪完了, 结果打字幕比剪片还累。
网上那些语音识别工具: 要么收费, 要么要配环境, 要么本地跑模型——风扇直接起飞。
如果你也被这件事折磨过, 今天这个工具可以直接帮你解脱。
👉 AsrTools
作用是: 把音频/视频,直接变成字幕文件。
不用教程,直接就会用:
下载 → 解压 → 双击打开 把文件/文件夹拖进去 → 等几分钟 → 完事
没有登录、没有弹窗、没有广告, 界面干净得像个记事本。

它用的是云端识别, 所以:
都能用。
而且—— 免费。
👉 把视频/音频转成文字/字幕
你可以拿来:
操作就三步: 拖文件 → 选格式 → 开始
音频: mp3、wav、aac、m4a、flac、ogg、wma…
视频: mp4、mov、mkv、avi、flv、webm、rmvb…
👉 视频不用转音频, 程序会自动帮你提取声音。 速度非常快,一小时的视频几分钟就搞定


剪完视频 → 拖进去 → 选 SRT
几分钟后,字幕文件直接生成。 导入剪辑软件对一下时间轴就能用。
👉 原本 2 小时的活,现在几分钟。
录音批量拖进去, 输出 TXT——直接就是文字稿。
支持多任务并行(默认 3 个), 一堆录音也能一起跑。
👉 适合:行政 / 记者 / 研究人员
视频转文字后, 可以直接搜索关键词复习, 不用来回拖进度条。
需要字幕样式的话, 还能导出 ASS 格式。
市面上不是没有类似工具, 但大多都卡在这几步:
普通人基本直接劝退。
而 AsrTools:
✔ 零门槛 打开就能用
✔ 零成本 不用账号,不限次数
✔ 不吃配置 识别在云端,本地只负责上传下载
直接: 👉 把“技术活”,做成了“体力活”。
界面是 PyQt5 写的, 很简洁,没有多余东西。
目前可用引擎主要是: BcutASR(必剪)
中文识别准确率还不错, 日常字幕、会议记录完全够用。
不过有几件事要提前说清楚:
如果你要更专业的玩法,可以看同个作者在维护的升级版 VideoCaptioner
你问为什么不直接推荐它? 因为以后要继续水一篇 因为你如果只有转字幕的需求,这个轻量软件够实用了
查看源码发现 subprocess.Popen 调用 ffmpeg 进行视频转音频处理,但没有配置 startupinfo 参数来隐藏命令行窗口~
不影响使用,执行完后自动关闭,但请不要手动关闭,会导致任务中断
GitHub 开源项目, 作者:WEIFENG2333(貌似还是个大学生)
👉 地址: https://github.com/WEIFENG2333/AsrTools
Windows 用户: 下载 Release 压缩包 → 解压 → 双击 exe
技术用户也可以源码运行:
git clone https://github.com/WEIFENG2333/AsrTools.git
cd AsrTools
uv pip install -r requirements.txt
uv run python asr_gui.py
不方便上 GitHub 的: 后台回复【014】拿
甚至还有小编优化版哦:

很多工具的价值, 不在于它有多强,
重要的是—— 帮你省掉那些本不该浪费的时间。
不用学新东西, 不用折腾配置, 打开就能用。
如果你经常要做字幕、整理录音, 这个工具,基本属于“必备”。
封面由AI生成