我已经使用PyPDF2创建了一个PDF Splitter。它将大小超过20Mb的PDF拆分为多个较小的PDF。 我使用的逻辑是将所有页面分割成单页PDF,找到每个页面的大小。添加大小,直到达到20Mb并拆分。 我面临的问题是,PDF中的某些页面几乎与原始PDF的大小相同。尽管当我手动进行页面提取时,页面大小约为500Kb。 不确定大小增加的原因。请帮我解决这些问题。for i in range(pdf_reader.
我是python的新手,我试着用(PyPDF2)来阅读PDF地图。我得到了这个作为输出Sample output of pdf map as text。我想从这个输出中提取某个模式与RIY-DIRAHH-015524.49121946.651068匹配的数据。我只需要那些只有这个模式的值。图案的长度在30-34之间变化。Complete output of PDF MAP。 请帮助提取/拆分特定值(匹配模式)。如果有任何其他解决方案可用于阅读PDF地图。敬请指