我正在寻找用于文档预处理的库(和指南)。我的意思是,例如,生成PDF、MS Office (Excel/Word)、Open Office格式的文件。
我发现那里很流行,尤其是Apache POI和iText。你知道有哪本书描述了文档预处理库(对于iText,我找到了"iText in Action")?
我也想比较一下库。
有什么线索吗?
发布于 2012-09-10 07:04:03
对于文件格式本身,许多细节都可以在网上找到。据我所知没有书。但这里有一些在线参考的一些办公文档文件格式。
对于Microsoft Office文档(Word、Excel、PowerPoint),格式为发布的http://www.microsoft.com/openspecifications/en/us/programs/osp/office-file-formats/default.aspx或http://msdn.microsoft.com/en-us/library/cc313105%28v=office.12%29.aspx
Microsoft站点包含一些有关如何分析Office类型文件的示例,这些示例可能对您有所帮助。
对于Open Office,您可以查看http://www.openoffice.org/xml/general.html或https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office
但以上内容更像是参考手册,而不是让您轻松解析这些文档的教程或库。
https://stackoverflow.com/questions/12337789
复制相似问题