我有两个数据帧(更多在现实生活中)。我的目标是用skimr包生成摘要报告,然后将它们作为文件导出到文件夹中。他们也会有不同的文件名。使其不那么直接的问题是I需要名称中带有“日期”的变量的变量类型作为类型转换为日期变量(这样我就可以生成范围和中位数等,而日期作为数据类型)。另外,另一个名为"USER_ID“的变量将被转换为字符数据类型,而不是默认数字。
df1 <- data.frame(x = rep(3, 3), USER_ID = C(292932, 293923, 392343), CONTACT_DATE = C(4/3/2022, 3/3/2012, 4/3/2011))
df2 <- data.frame(x = rep(5, 3), USER_ID = C(292932, 293423, 392343), ORDER_DATE = C(3/4/2012, 4/5/2019, 4/3/2012))只是找到了一种更快的方法来完成以下工作:
df1
df1$CONTACT_DATE<- as.Date(df1$CONTACT_DATE, "%m/%d/%Y")
df1$USER_ID<-as.character(df1$USER_ID)
df1_summary<-skim(df1)后面是一个函数,它可以将df1_summary输出到文件中。
df2
df2$ORDER_DATE<- as.Date(df2$ORDER_DATE, "%m/%d/%Y")
df2$USER_ID<-as.character(df2$USER_ID)
df2_summary<-skim(df2)后面是一个函数,它可以将df2_summary输出到文件中。
摘要输出最好包含整个浏览输出,它可以是任何可编辑的文件格式。
提前谢谢你!
发布于 2022-08-21 16:19:44
使用skimr的最佳工作流程是迭代。我建议您编写一个函数来转换数据帧中的任何列,并在名称中包含字符串日期。然后对转换后的数据运行skim()。您可以使用dplyr mutate()来完成此操作,dplyr具有用于处理此问题的tidyselect函数。一旦有了函数,就可以使用purrr或lapply在所有数据帧上使用该函数。
然后,类似地使用purr或一些应用函数运行skimr的步骤。
你在储蓄方面所做的事情取决于你想要如何保存它。您想要浏览对象(一个巨大的数据帧)还是类似于打印的内容。
https://stackoverflow.com/questions/73153714
复制相似问题