相对来说,我对熊猫和探索的东西还比较陌生。我有一个要求,解释如下。我使用的是AWS控制台(SageMaker)
文件夹中的一组SAS7BDAT文件,每个文件都具有不同的结构。这些文件将转换为CSV,但有以下挑战。
。
我尝试了下面的代码,但不知道我错过了什么
from sas7bdat import SAS7BDAT
file = "<folder/name/aaaa.sas7bdat"
with SAS7BDAT(file, skip_header=False) as reader:
df = reader.to_data_frame()
df
import re
df1=df.apply(lambda k:re.sub("[\n\r\t]", "",df), axis=0, raw=False, result_type=None, args=())
df1有人能帮帮我吗?(我尚未尝试转换为csv,但希望查看数据后的质量校正)
发布于 2021-05-19 19:39:53
下午好,
导入SAS数据集
当重要的SAS文件进入Python时,尝试使用Pandas .read_sas()函数。如果字符给您带来麻烦,请尝试将encoding='latin-1'传递给函数。
import python as pd
df = pd.read_sas(file, encoding='latin-1')
df.head()如果正则表达式步骤仍然是必需的,那么可以提供文本当前状态的示例以及您希望它的样子吗?
https://stackoverflow.com/questions/67437204
复制相似问题