我已经能够使用类似于以下代码的代码使用: PYMuPDF阅读PDF的内容:
myfile = r"C:\users\xxx\desktop\testpdf1.pdf"
doc =fitz.open(myfile)
page=doc[1]
text = page.getText("text")要读取PDF文件的内容,但是我不能读取文本框注释,有办法这样做吗?
发布于 2018-05-22 20:53:29
在页面对象上使用firstAnnot。一旦您有了一个注释对象,看起来您就可以调用它上的next并获取其他的注释对象。注意示例位于Annot页面的底部。
我从一个Word文档中创建了一个PDF,并添加了一个文本框和一个便条。下面的代码打印每个内容。查看info内部以获得您可能需要的其他信息。
import fitz
pdf = fitz.open('WordTest.pdf')
page = pdf[0]
annot = page.firstAnnot
print(annot.info['content'])
next_annot = annot.next
print(next_annot.info['content'])
pdf.close()https://stackoverflow.com/questions/50475752
复制相似问题