首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Camelot查找PDF尺寸

使用Camelot查找PDF尺寸
EN

Stack Overflow用户
提问于 2019-01-14 14:32:44
回答 2查看 1.9K关注 0票数 4

我正在使用Camelot来阅读完整的PDF,并从每个PDF中提取约112个属性。

我使用表区来提取属性

代码语言:javascript
复制
 test_variable = camelot.read_pdf(filename, flavor='stream', 
                 table_areas=['38, 340 ,50, 328']) 

问题是,对于所有文档中的相同属性,表区域并不是恒定的。有时我会在另一个文档的x或y坐标中找到几个像素以下的相同属性。

代码语言:javascript
复制
 test_variable = camelot.read_pdf(filename, flavor='stream', 
                 table_areas=['38,350,50,338']) 

有没有一种方法可以在不考虑提取任何文档的情况下,从相同的区域获得确切的属性?

EN

回答 2

Stack Overflow用户

发布于 2019-01-14 19:07:11

也许选项table_regions (在0.7中引入)可以帮助您。

https://camelot-py.readthedocs.io/en/master/user/advanced.html#specify-table-regions

指定table_regions时,Camelot将仅分析指定的区域以查找表。

您可以定义一个更大的table_regions区域,Camelot将在该区域中搜索表。

票数 2
EN

Stack Overflow用户

发布于 2019-12-04 05:04:53

Camelot使用opencv的坐标系,尺寸可以使用opencv的.shape获得

请参阅camelot图像处理here和opencv文档here的源代码

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54176697

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档