如何使用jupyter实验室从pdf文件中读取和提取表格?
一个典型的pdf文件与文本之间的文字字幕和表格。我需要编码来提取特定标题下的表格,并清理一些不需要的文本,比如页码。
有哪些编码可以做到这一点?
发布于 2022-09-19 13:34:23
Tabula-py:您可以解析PDF并将其转换为CSV、TSV、JSON或熊猫DataFrame。
https://stackoverflow.com/questions/73774124
相似问题