嗨,我正在尝试读取一个excel文件,这是从用户界面上传到DBX文件存储。我可以看到该文件位于/Filestore/tables目录下,并且我正在尝试使用以下代码创建一个pandas数据帧
import pandas as pd
df = pd.read_excel("/dbfs/FileStore/tables/abc.xlsx")
display(df)我收到下面的错误
FileNotFoundError: Errno 2没有这样的文件或目录:'/dbfs/FileStore/tables/abc.xlsx
我知道该路径不是相对于我当前的工作目录。我想知道如何使用python从文件存储中指向该文件。
我尝试过的东西:
我在路径中使用了/FileStore/tables/abc.xlsx,但它不起作用
我知道使用spark-excel jar的scala代码可以工作,但我不能执行scala命令,因为我的组织没有也不会为我提供执行scala命令的权限。
你有什么办法让它工作吗?
发布于 2021-05-19 23:24:22
创建表格时,该文件不会存储为excel文件。您可以通过Spark API访问数据。
如果不想使用考拉,还可以将表读入考拉数据框架,然后将其转换为熊猫。
如果您不想使用Spark或koalas,那么将文件上传到/dbfs/FileStore并使用该位置文件中的read_excel。
https://stackoverflow.com/questions/67605983
复制相似问题