有没有人知道我可以在OS X/Linux上使用一个库来解析Word文件并将内容输出为HTML?
我已经看过win32ole了,但据我所知,它只适用于Windows,尽管我可能是错的。
有什么建议吗?
发布于 2008-12-17 22:25:36
Word文档格式(暂时忽略docx )非常糟糕,而且还在不断变化。这就是为什么解析它们的Ruby库如此之少(读:零)。
我推荐使用JRuby和一些已建立的Java库来读取文档格式。谷歌应该能帮到你:http://schmidt.devlib.org/java/libraries-word.html。
有一个用于读取Ruby文件格式的Java项目,POI (http://poi.apache.org/),他们确实有MIcrosoft绑定(http://poi.apache.org/poi-ruby.html),但我不确定这些是不是最新的。他们的网站上说Ruby绑定是针对1.8.2的……
https://stackoverflow.com/questions/375861
复制相似问题