首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >连接Excel文件,使用文件名作为引发错误的索引

连接Excel文件,使用文件名作为引发错误的索引
EN

Stack Overflow用户
提问于 2018-09-17 13:56:00
回答 1查看 139关注 0票数 1

我有大约20个XLSX文件,范围从4-10毫巴。

我想在这些xlsx文件中找到一个特定的表,并将它们连接到一个文件中。

每个xlsx文件都是按周顺序命名的,而我试图解析的表没有日期,因此我使用file_name作为索引,并将反向工程一个星期日期。

我使用以下代码,我经常使用这些代码将多个文件连接到一个df中。我还使用basename添加名称,但得到以下错误。

代码语言:javascript
复制
ValueError: Length mismatch: Expected axis has 461 elements, new values have 457 elements


import pandas as pd
from os.path import basename
import os
import glob
path = os.getcwd()
allFiles = glob.glob(path + "/*.xlsx")

    frame = pd.DataFrame()
    master_list = []

for file_ in allFiles:
    df = pd.read_excel(file_,sheet_name = "Base data",index_col=None, 
    header=0)
    df.index = [os.path.basename(f)] * len(data)
    master_list.append(df)

    frame = pd.concat(master_list)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-09-17 14:01:38

可以对DataFrames列表使用列表理解,然后在concat中创建用于参数keys的文件名列表。

代码语言:javascript
复制
dfs = [pd.read_excel(f, sheet_name="Base data",index_col=None,header=0) for f in allFiles]

keys = [os.path.basename(f) for f in allFiles]
frame = pd.concat(dfs, keys=keys)
#if want remove default index values
#frame = pd.concat(dfs, keys=keys).reset_index(level=1, drop=True)
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52369454

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档