有没有人知道有什么好的方法可以将Microsoft Word文档转换成MP3或WAV格式,这样听力受损的人就可以“收听”我存储在基于web的文档管理系统中的文档?
我已经构建了这样的界面,这样某人就可以使用电话获取可用的文档列表,并通过电话向他们“阅读”日期和标题,但现在我希望能够让某人实际收听存储在系统中的Word文件的内容。
理想情况下,允许我在每次上传后转换DOC -> MP3的.NET库或实用程序是最好的,但也可以按需“读取”文件。
发布于 2010-06-17 18:58:37
如果您的Word文档是以Office2007引入的新OpenXML格式存储的,那么您可能希望了解一下Daisy工具链。
SourceForge上有一个免费的转换器,可以从您的Word文档创建Daisy文件。屏幕阅读器可以理解Daisy格式,也可以使用转换器将Daisy文件转换为音频文件。
有关详情,请参阅:
发布于 2010-06-12 23:55:51
您可以使用System.Speech.Recognition来配置您的TTS引擎,使用System.Speech.Synthesis名称空间来记录/保存(保存到.WAV)。在System.Speech.AudioFormat中,您可以配置WAV文件的输出参数。对于Word,您只需使用COM Interop抓取文件,打开它并获取所需的任何类型的块中的文本,然后将其提供给托管的SAPI。我可能会把事情分成段落/运行,表格,参考和其他。
如果你正在寻找一种更强大的技术,其中一个比较著名的文语转换引擎是NaturallySpeaking's Server SDK -他们最近添加了一个“音频流”功能,允许在飞行中的文语转换,所以没有必要预先录制到一个永久的音频文件(但如果你想,它也可以预先录制)。你还可以查看他们的AudioMining SDK,它允许对音频文件中的语音文本进行完整的索引和搜索。他们的SDK都是COM,而不是.NET。
发布于 2010-06-11 03:12:24
从Word中提取文本是最容易的部分。有一些tts库可用,但商品库往往很昂贵。Acapela (http://www.acapela-group.com)可能是我发现的最好的,而且它支持声音文件的输出。我不确定是否支持MP3,但转换声音格式很简单。
祝你好运。
https://stackoverflow.com/questions/3017270
复制相似问题