文章/答案/技术大牛

发布

社区首页 >问答首页 >MP3/WAV到文本(语音识别)

问MP3/WAV到文本(语音识别)
EN

Software Recommendation用户

提问于 2015-06-28 22:24:07

回答 5查看 3.5K关注 0票数 13

我正在寻找一个软件( Windows或Linux)，可以将MP3/WAV文件转换为文本。

可以通过语音识别自动生成文本的内容，如YouTube上的自动字幕，但可以将这些字幕输出到文本文件中。

audio

speech-recognition

回答 5

Software Recommendation用户

发布于 2017-04-18 09:33:01

沃森对文本的讲话

这是IBM语音到文本服务的在线演示。您也可以与任何可在其网页上找到的SDK一起使用。它可以接受一个WAV文件，但不是MP3，所以您需要首先转换MP3s。

在页面上，选择要使用的语言，以及任何想要识别多个说话人的语言。上传音频文件并等待结果。

这绝不是完美的。由于它的本质，它没有机会训练它很好地识别一个特定的声音，这是转录软件的一个优势(但那些通常需要麦克风输入，当然，你可以尝试一个音频循环回来)。另一方面，沃森在不断改进，并且有能力识别多个说话者(在某些情况下)，这是转录软件所不能做的(也不打算做)。

票数 2

Software Recommendation用户

发布于 2017-02-20 06:52:57

在Windows上有语音识别API，它非常容易使用，就像在几个函数调用中一样，您已经设置好了。

https://msdn.microsoft.com/en-us/library/jj127860.aspx

否则，尽管速度较慢，您可以使用或IBM和亚马逊的对互联网连接进行同样的操作。

您始终可以将音频输出重定向到音频捕获设备(您可以使用音频回送设备在windows上这样做，并且大多数OSes支持这样做)，在这种情况下，计算机的所有音频输出(例如YouTube音频)都可以被上述API捕获。

不幸的是，我并不知道专门用于此的应用程序，但对于Windows，这可能包含您所需的内容。

https://www.microsoft.com/en-us/download/details.aspx?id=27224

否则一点编程技巧，这应该是很容易做到-我会感到惊讶，如果没有人还没有。

一个广泛的语音识别软件列表，其中一些软件可能包含将文本输出保存到我在这里找到的文件的能力：

https://en.wikipedia.org/wiki/Speech_识别_软件_为_Linux

和

https://en.wikipedia.org/wiki/List_的_讲演_识别_软件

票数 1

Software Recommendation用户

发布于 2021-07-19 00:10:09

使用Word中直接可用的办公室365你每月有300分钟的语音识别时间：

票数 0

页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://softwarerecs.stackexchange.com/questions/20720

复制

相似问题

问MP3/WAV到文本(语音识别)
EN

回答 5

Software Recommendation用户

Software Recommendation用户

Software Recommendation用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问MP3/WAV到文本(语音识别)EN

回答 5

Software Recommendation用户

Software Recommendation用户

Software Recommendation用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问MP3/WAV到文本(语音识别)
EN