文章/答案/技术大牛

发布

社区首页 >问答首页 >使用Camelot查找PDF尺寸

问使用Camelot查找PDF尺寸
EN

Stack Overflow用户

提问于 2019-01-14 14:32:44

回答 2查看 1.9K关注 0票数 4

我正在使用Camelot来阅读完整的PDF，并从每个PDF中提取约112个属性。

我使用表区来提取属性

 test_variable = camelot.read_pdf(filename, flavor='stream', 
                 table_areas=['38, 340 ,50, 328'])

问题是，对于所有文档中的相同属性，表区域并不是恒定的。有时我会在另一个文档的x或y坐标中找到几个像素以下的相同属性。

 test_variable = camelot.read_pdf(filename, flavor='stream', 
                 table_areas=['38,350,50,338'])

有没有一种方法可以在不考虑提取任何文档的情况下，从相同的区域获得确切的属性？

python-camelot

python

pdf-extraction

回答 2

Stack Overflow用户

发布于 2019-01-14 19:07:11

也许选项table_regions (在0.7中引入)可以帮助您。

https://camelot-py.readthedocs.io/en/master/user/advanced.html#specify-table-regions

指定table_regions时，Camelot将仅分析指定的区域以查找表。

您可以定义一个更大的table_regions区域，Camelot将在该区域中搜索表。

票数 2

Stack Overflow用户

发布于 2019-12-04 05:04:53

Camelot使用opencv的坐标系，尺寸可以使用opencv的.shape获得

请参阅camelot图像处理here和opencv文档here的源代码

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54176697

复制

相似问题

问使用Camelot查找PDF尺寸
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Camelot查找PDF尺寸EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Camelot查找PDF尺寸
EN