我手动将文章转换为Markdown语法已经有几天了,而且变得相当单调乏味。其中一些是3或4页,斜体和其他强调文本贯穿始终。有没有更快的方法将(.rtf|.doc)文件转换成干净的Markdown Syntax,我可以利用?
发布于 2011-09-21 05:34:57
如果你碰巧在mac上,textutil可以很好地将doc、docx和rtf转换为html,pandoc也可以很好地将结果转换为markdown:
$ textutil -convert html file.doc -stdout | pandoc -f html -t markdown -o file.md我有一个前段时间拼凑在一起的script,它试图使用textutil、pdf2html和pandoc将我抛出的任何东西转换为markdown。
发布于 2012-11-16 23:33:41
如果您对使用.docx格式持开放态度,您可以使用我放在一起的这个PHP脚本,它将提取.docx,运行一些XSL转换,并输出相当不错的Markdown等效项:
https://github.com/matb33/docx2md
请注意,它是从命令行工作的,并且在其界面中相当基础。然而,它会完成这项工作!
如果脚本不能很好地为您工作,我鼓励您将您的.docx文件发送给我,这样我就可以重现您的问题并修复它。如果您愿意,可以在GitHub中记录问题或直接与我联系。
发布于 2011-08-27 05:01:44
Pandoc是一个很好的命令行转换工具,但同样,您首先需要将输入转换为Pandoc可以读取的格式,即:
https://stackoverflow.com/questions/1043768
复制相似问题