在软件v4.1版本之后,MoneyPrinterPlus已经支持fasterWhisper本地语音识别模型。 所以不需要第三方的fasterWhisper服务。但是我们需要下载对应的fasterWhipser模型到MoneyPrinterPlus中。 进入到MoneyPrinterPlus的fasterwhisper目录下:cd fasterwhisper执行git clone命令:git clone https://huggingface.co/Systran 语音识别配置中我们选择本地模型,即可使用到fasterWhisper了。同样的在视频混剪区域,我们也可以选择本地模型,即可使用到fasterWhisper了。 总结因为是本地运行的fasterWhisper,所以在运行中可能会出现一些环境的问题。大家可以参考fasterWhisper的说明来解决。
分钟样本即可复刻音色品牌形象统一多平台适配器智能识别各平台分辨率/时长要求全渠道内容分发技术架构解析graph TD A[视频输入] --> B{识别引擎} B -->|OpenAI Whisper| C[字幕生成] B -->|FasterWhisper
最近有很多优秀的语音合成TTS工具,目前MoneyPrinterPlus已经集成了ChatTTS和fasterWhisper。
支持PyTorch、FasterWhisper等多推理后端,针对NVIDIA GPU、Intel CPU、Apple Silicon芯片做专项优化,不同硬件配置均能实现流畅运行。
配置说明 KrillinAI的配置主要涉及以下几个方面: 转录服务提供商:可选择"openai"、"fasterwhisper"或"aliyun",分别对应OpenAI的Whisper服务、本地faster-whisper