我如何在python中读取pdf ?我知道一种将它转换为文本的方法,但是我想直接从pdf中读取内容。
有人能解释一下python中哪个模块最适合pdf提取吗?
发布于 2017-08-21 10:49:42
您可以在python中使用t提取模块。
提取物
用于安装
pip install textract阅读pdf
import textract
text = textract.process('path/to/pdf/file', method='pdfminer')关于详细的提物
https://stackoverflow.com/questions/45795089
复制相似问题