由于某些原因,当我尝试使用pandas.read_hdf()方法从S3读取hdf文件时,当我放置一个s3 url时得到一个FileNotFoundError。这个文件确实存在,我尝试过在同一个s3目录中对csv文件使用pandas.read_csv()方法,而且效果很好。还有什么我需要做的吗?代码如下:
import boto3
import h5py
import s3fs
import pandas as pd
csvDataframe = pd.read_csv('s3://BUCKET_NAME/FILE_NAME.csv', key='df')
print("Csv data:")
print(csvDataframe)
dataframe = pd.read_hdf('s3://BUCKET_NAME/FILE_NAME.h5', key='df')
print("Hdf data:")
print(dataframe)下面是错误:
FileNotFoundError: File s3://BUCKET_NAME/FILE_NAME.h5 does not exist在实际代码中,BUCKET_NAME和FILE_NAME被替换为它们的实际字符串。
发布于 2019-12-19 13:34:28
请确保文件扩展名为.h5
https://stackoverflow.com/questions/59383732
复制相似问题