首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >MP3/WAV到文本(语音识别)

MP3/WAV到文本(语音识别)
EN

Software Recommendation用户
提问于 2015-06-28 22:24:07
回答 5查看 3.5K关注 0票数 13

我正在寻找一个软件( Windows或Linux),可以将MP3/WAV文件转换为文本。

可以通过语音识别自动生成文本的内容,如YouTube上的自动字幕,但可以将这些字幕输出到文本文件中。

EN

回答 5

Software Recommendation用户

发布于 2017-04-18 09:33:01

沃森对文本的讲话

这是IBM语音到文本服务的在线演示。您也可以与任何可在其网页上找到的SDK一起使用。它可以接受一个WAV文件,但不是MP3,所以您需要首先转换MP3s。

在页面上,选择要使用的语言,以及任何想要识别多个说话人的语言。上传音频文件并等待结果。

这绝不是完美的。由于它的本质,它没有机会训练它很好地识别一个特定的声音,这是转录软件的一个优势(但那些通常需要麦克风输入,当然,你可以尝试一个音频循环回来)。另一方面,沃森在不断改进,并且有能力识别多个说话者(在某些情况下),这是转录软件所不能做的(也不打算做)。

票数 2
EN

Software Recommendation用户

发布于 2017-02-20 06:52:57

在Windows上有语音识别API,它非常容易使用,就像在几个函数调用中一样,您已经设置好了。

https://msdn.microsoft.com/en-us/library/jj127860.aspx

否则,尽管速度较慢,您可以使用或IBM和亚马逊的对互联网连接进行同样的操作。

您始终可以将音频输出重定向到音频捕获设备(您可以使用音频回送设备在windows上这样做,并且大多数OSes支持这样做),在这种情况下,计算机的所有音频输出(例如YouTube音频)都可以被上述API捕获。

不幸的是,我并不知道专门用于此的应用程序,但对于Windows,这可能包含您所需的内容。

https://www.microsoft.com/en-us/download/details.aspx?id=27224

否则一点编程技巧,这应该是很容易做到-我会感到惊讶,如果没有人还没有。

一个广泛的语音识别软件列表,其中一些软件可能包含将文本输出保存到我在这里找到的文件的能力:

https://en.wikipedia.org/wiki/Speech_识别_软件_为_Linux

https://en.wikipedia.org/wiki/List_的_讲演_识别_软件

票数 1
EN

Software Recommendation用户

发布于 2021-07-19 00:10:09

票数 0
EN
页面原文内容由Software Recommendation提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://softwarerecs.stackexchange.com/questions/20720

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档