文章/答案/技术大牛

发布

社区首页 >问答首页 >使用tabula-py为什么我会得到一个列表而不是Dataframe？

问使用tabula-py为什么我会得到一个列表而不是Dataframe？
EN

Stack Overflow用户

提问于 2021-02-04 00:50:33

回答 2查看 3.3K关注 0票数 4

输出

我想处理PDF文件，特别是表格。我编码这个

import pandas as pd
import numpy as np
import tabula
from tabula import read_pdf
tab= tabula.read_pdf('..\PDFs\Ala.pdf',encoding='latin-1', pages ='all')
tab

但是我得到了一个价值列表，如下所示：

[    Nombres  Edad Ciudad
0    Noelia    20   Lima
1  Michelie    45   Lima
2    Ximena    18   Lima
3    Miguel    43   Lima]

我不能分析它死了它不是一个数据框架。这只是一个示例，真正的PDF文件包含文本和几个页面之间的表。

有谁能帮我解决这个问题吗？

pdf

python

pandas

csv

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-02-07 10:16:03

tabula应该返回一个Pandas列表，每个表在PDF中都有一个。您可以按以下方式显示(并与它们一起工作)：

import pandas as pd
import numpy as np
import tabula
from tabula import read_pdf

dfs = tabula.read_pdf('..\PDFs\Ala.pdf', encoding='latin-1', pages='all')
print(f"Found {len(dfs)} tables")

# display each of the dataframes
for df in dfs:
    print(df.size)
    print(df)

票数 3

Stack Overflow用户

发布于 2022-08-20 09:13:39

tabula返回Pandas DataFrame的列表。但是我们可以使用下面的语句将这个列表转换为Pandas DataFrame。

import tabula
import pandas

tab = pandas.DataFrame(tabula.read_pdf('..\PDFs\Ala.pdf', pages ='all')[0])

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/66037880

复制

相似问题

问使用tabula-py为什么我会得到一个列表而不是Dataframe？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用tabula-py为什么我会得到一个列表而不是Dataframe？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用tabula-py为什么我会得到一个列表而不是Dataframe？
EN