猫头虎分享:如何在本地使用 openai-whisper 实现音频转文本? 最近很多小伙伴咨询 如何在本地环境使用 OpenAI 的 Whisper 模型把音频文件转换成文本。 准备工具和环境 在开始之前,确保你的本地电脑具备以下条件: Python 环境:Python 3.8 及以上版本 ffmpeg:处理音频所必需的工具 openai-whisper:OpenAI 提供的开源语音识别模型 Ubuntu) sudo apt update && sudo apt install ffmpeg # macOS (使用 Homebrew) brew install ffmpeg ️ 步骤 2:安装 openai-whisper 在终端输入: pip install openai-whisper 如果你的网络不稳定,可以使用国内镖像加速: pip install openai-whisper -i https://pypi.tuna.tsinghua.edu.cn 总结与展望 通过以上步骤,你已经成功在本地环境中使用 openai-whisper 模型实现了音频转文本 。
choco install ffmpeg # on Windows using Scoop (https://scoop.sh/) scoop install ffmpeg pip install -U openai-whisper
打开文件夹:D:\CHATGPT For TikTok TikTok Mastery with CHATGPT 文件夹里面有多个子文件夹,子文件夹中有mp3格式的音频,读取子文件夹中的所有音频文件; 用openai-whisper 库将mp3格式音频识别为和音频同名的文本文档,然后保存在和mp3音频的同一个文件夹中; 注意:Whisper语音模型使用medium模型,要识别的音频为英文内容 下面是openai-whisper库的使用示例 用conda创建一个3.9版本的Python环境:conda create n myenv python=3.9 在这个虚拟环境中安装whisper库:pip install openai-whisper
安装 apt install ffmpeg pip install -U openai-whisper 使用 指令 whisper video.mp4 whisper audio.flac audio.mp3
打开文件夹:D:\CHATGPT For TikTok TikTok Mastery with CHATGPT 文件夹里面有多个子文件夹,子文件夹中有mp3格式的音频,读取子文件夹中的所有音频文件; 用openai-whisper 库将mp3格式音频识别为和音频同名的文本文档,然后保存在和mp3音频的同一个文件夹中; 注意:Whisper语音模型使用medium模型,要识别的音频为英文内容 下面是openai-whisper库的使用示例
mylangrobot 软件分析根据开头描述的项目流程具体的流程如下:音频输入:首先录入音频指令音频处理:使用“openai-whisper”对音频进行处理,转化为文本语言模型交互:利用GPT-4模型处理转换后的文本指令 : def __init__(self): self.r = sr.Recognizer() self.mic = sr.Microphone() # openai-whisper
离线使用对本地显卡有一定要求,具体可以参考官网 首先,在本地安装 ffmpeg https://ffmpeg.org/ 然后安装依赖包 # 安装依赖 # 注意:python版本必须3.8以上 pip3 install openai-whisper
离线使用对本地显卡有一定要求,具体可以参考官网 首先,在本地安装 ffmpeg https://ffmpeg.org/ 然后安装依赖包 # 安装依赖 # 注意:python版本必须3.8以上 pip3 install openai-whisper
四、实现代码与示例 以下是一个基于Python和OpenAI Whisper模型生成视频字幕的示例代码: # 安装必要的依赖库 # pip install ffmpeg-python openai-whisper
语音识别部分基于 openai-whisper 离线模型,文字翻译部分使用 Google 翻译接口,文字合成语音分布则使用 Microsoft Edge tts,背景音乐去除部分用到了 Spleeter
其语音识别基于 openai-whisper 离线模型、文字翻译使用 google翻译接口,文字合成语音使用 Microsoft Edge TTS,背景音乐去除使用 Spleeter。
语音识别支持 faster-whisper模型 openai-whisper模型 和 GoogleSpeech zh_recogn阿里中文语音识别模型 。
安装whipser并测试 sudo apt update && sudo apt install ffmpeg pip install setuptools-rust pip install -U openai-whisper
gh_mirrors/whisp/whisper/overview https://github.com/jhj0517/Whisper-WebUI 安装Whisper pip install -U openai-whisper
print(res) return res[0]['text'] ''' https://github.com/openai/whisper pip install -U openai-whisper
ffmpegArch Linux: sudo pacman -S ffmpeg 5 .安装 Whisper安装Whisper:通过pip安装Whisper的最新版本,使用以下命令: pip install -U openai-whisper
goplaces │ ◻ himalaya │ ◻ mcporter │ ◻ nano-banana-pro │ ◻ nano-pdf │ ◻ obsidian │ ◻ ️ openai-whisper
使用示例: pip install -U openai-whisper python convert_hf_to_openai.py \ --checkpoint openai/whisper-tiny