我正在执行一些抓取和总结任务,并发现报纸非常适合我的(大部分)需求。我有一系列的pdf文件,我也需要查看和执行类似的任务。我可以找到其他的应用程序来打开和提取故事,希望能直接为报纸提供文本,并让它做它的事情.不过,到目前为止,我还不知道如何做到这一点。有什么建议吗?
发布于 2022-04-13 22:41:24
这是一个很好的包,可以解决您的困境: pymupdf,请参阅
https://pymupdf.readthedocs.io/en/latest/
然后跑:
import fitz
跟着医生走。
https://stackoverflow.com/questions/48991701
相似问题