我正在尝试提取文本从扫描的pdf使用PyPDF2。有些pdf包含垂直排列的文本。但页面的方向是肖像。是否有任何方法可以识别文本是否垂直对齐并使用pdfminer或PyPDF2读取PDF中的垂直行?
发布于 2022-07-10 11:24:59
目前还没有办法在PyPDF2中做到这一点(我是PyPDF2的维护者)。
另见:https://github.com/py-pdf/PyPDF2/issues/1071
https://stackoverflow.com/questions/52530293
相似问题