有没有等同于读写表格文件的Python语言,比如SAS sas7bdat文件?
我的团队正在远离SAS,我们希望使用以下方法在Python中复制SAS过程:
1)从Excel、CSV、DB等多种来源拉取数据。
2)使用新信息更新我们的数据仓库,并将此数据导出为Python表文件(下一步使用)
3)而不是从我们的仓库中提取数据(非常慢),我们希望读入那些Python表文件,然后对更大的数据集进行一些数据匹配。
我们尽量避免使用sas7bdat (SASPy)文件,因为我们不会再使用SAS了
任何建议,见解,我们都非常感谢!
发布于 2019-06-25 22:28:49
与SAS不同,Python没有原生数据格式。但是,有一些模块实现了用于序列化和反序列化Python对象的二进制协议。考虑使用HDF5格式保存和读取文件(https://www.h5py.org/)。另一种可能性是Pickle (https://docs.python.org/3/library/pickle.html)。
发布于 2019-06-26 00:18:47
Parquet也值得考虑。
https://stackoverflow.com/questions/56753934
复制相似问题