首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何查找camelot的表区域

如何查找camelot的表区域
EN

Stack Overflow用户
提问于 2019-09-20 17:00:51
回答 2查看 1.7K关注 0票数 3

正如在camelot中提到的,我们可以从特定区域提取表,例如:

代码语言:javascript
复制
tables = camelot.read_pdf('table_regions.pdf', table_regions=['170,370,560,270'])

但是我怎样才能为我的pdf找到这些区域。

EN

回答 2

Stack Overflow用户

发布于 2019-09-20 18:40:21

您可以通过一些可视化调试来检测此区域。

https://camelot-py.readthedocs.io/en/master/user/advanced.html#visual-debugging

票数 1
EN

Stack Overflow用户

发布于 2020-09-29 18:00:48

我知道这是一个迟来的回复--但我只是想到了一个可能的解决方案。

如果您正在寻找一种自动提取方法,您可以在第一步中使用lattice,使用tables[0]._bbox检索表边界,并在第二个调用中使用这些数字来camelot.read_pdf()到参数table_areas中。

请注意,对于bbox,它们的排序格式很奇怪。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58025146

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档