如何从Open Office文档中获取文本?
我使用OO将微软的word和excel文件转换成PDF格式,以便在网页上显示。但在某些情况下,可能会面临损坏的文件,并且损坏的文件会以非常大的xml格式打开。
为了解决这个问题,我将获得第一行的内容,如果xml标签存在,建议用户下载文档,并尝试修复或打开它在微软的word。但是我没有找到任何关于如何处理文本的详细文档和示例。
发布于 2016-05-27 14:58:39
从标签中,我假设您正在使用C#查找信息。这里没有太多的例子,但是可以看看Andrew Pitonyak's Macro Document的24.1节。该示例将文本插入到writer文档中。
读取文本的一种方法是创建一个光标,选择第一行,然后通过调用oCursor.getString()获取值。This page用Basic显示了一些示例命令,您可以将其改编为适用于C#的命令。
https://stackoverflow.com/questions/37453404
复制相似问题