我正在使用MS Word应用程序接口生成.docx,其中包含从数据库中提取的数据,在其中我应用了相应的样式、字体、符号等。如果从数据库中提取的数据相当庞大,则在.docx文件中显示这些数据时会出现问题。我发现MS Word 2007在内部会通过标签写入一些内容,而这些标签可能不是显示数据所需的。因此,我正在计算转换为.xml文件时所需的MS Word标签。这样我就可以避免不必要的标记,只构建显示数据所需的相应标记。因此,我计划编写自己的.xml与MS Word标签是必要的,而不是从.docx文件生成一个.XML
我的问题是:
1)在.docx到document.xml的转换过程中,MS Word会生成一些可能不需要的标签,这是否正确?这会让它很重吗?如果是,那么标记是什么,以便我在使用自己的.xml文件写入时可以避免使用它们。2)请发送链接了解MS Word标签及其优点,哪些标签是需要的,哪些是不需要的? 3)我写一个类似document.xml (.docx转换)的新.xml的方法是否值得继续下去,这样我就可以用我需要的标签构建.xml,这样我就可以提高数据显示的性能?
请对此稍加说明,并提前表示感谢..
谢谢,Rithu
发布于 2010-03-16 08:39:36
要做到这一点,你需要在更多的detail中学习WordprocessingML。这当然不是不可能的,但从一开始就是一个相当长的学习曲线。也许最好的起点是这个eBook。如果你走手动路线,你需要一个压缩技术。如果您在Visual Studio中,则可以使用Open XML SDK使所有这些内容的编写变得更容易。
至于你关于“不必要的标签”的问题,很难相信文件中会有很多不必要的东西。但这取决于您认为不需要的内容-例如,如果一个单词被捕获为拼写错误,则运行标记上将有"dirty=1“属性。如果您可以显示拼写错误的单词,那么可以认为这是不必要的。这真的取决于你要显示的是什么以及在什么地方。
https://stackoverflow.com/questions/2424177
复制相似问题