我正在寻找一个软件( Windows或Linux),可以将MP3/WAV文件转换为文本。
可以通过语音识别自动生成文本的内容,如YouTube上的自动字幕,但可以将这些字幕输出到文本文件中。
发布于 2017-04-18 09:33:01
这是IBM语音到文本服务的在线演示。您也可以与任何可在其网页上找到的SDK一起使用。它可以接受一个WAV文件,但不是MP3,所以您需要首先转换MP3s。
在页面上,选择要使用的语言,以及任何想要识别多个说话人的语言。上传音频文件并等待结果。
这绝不是完美的。由于它的本质,它没有机会训练它很好地识别一个特定的声音,这是转录软件的一个优势(但那些通常需要麦克风输入,当然,你可以尝试一个音频循环回来)。另一方面,沃森在不断改进,并且有能力识别多个说话者(在某些情况下),这是转录软件所不能做的(也不打算做)。
发布于 2017-02-20 06:52:57
在Windows上有语音识别API,它非常容易使用,就像在几个函数调用中一样,您已经设置好了。
https://msdn.microsoft.com/en-us/library/jj127860.aspx
否则,尽管速度较慢,您可以使用或IBM和亚马逊的对互联网连接进行同样的操作。
您始终可以将音频输出重定向到音频捕获设备(您可以使用音频回送设备在windows上这样做,并且大多数OSes支持这样做),在这种情况下,计算机的所有音频输出(例如YouTube音频)都可以被上述API捕获。
不幸的是,我并不知道专门用于此的应用程序,但对于Windows,这可能包含您所需的内容。
https://www.microsoft.com/en-us/download/details.aspx?id=27224
否则一点编程技巧,这应该是很容易做到-我会感到惊讶,如果没有人还没有。
一个广泛的语音识别软件列表,其中一些软件可能包含将文本输出保存到我在这里找到的文件的能力:
https://en.wikipedia.org/wiki/Speech_识别_软件_为_Linux
和
发布于 2021-07-19 00:10:09
使用Word中直接可用的办公室365你每月有300分钟的语音识别时间:

https://softwarerecs.stackexchange.com/questions/20720
复制相似问题