我有一个PDF文件,其中包括文本,图像和表格。如何提取3,使其能够识别要提取的内容,并自行完成提取?
发布于 2020-04-03 02:26:40
Python有一个名为PDFMiner的包。请浏览其文档以进行文本提取。
这里是我要参考的地方:http://denis.papathanasiou.org/archive/2010.08.04.post.pdf
https://stackoverflow.com/questions/60998422
相似问题