我正在使用RevoscaleR,我已经成功地将csv文件转换成xdf文件,并将这些文件保存到本地磁盘。
但是,当我试图运行调用这些xdf文件的函数时,我会收到一条错误消息,即没有这样的文件或目录:
The file or directory 'P:/PROPENSITY/CL_Generic_Retail_201506' cannot be found.让我公开一下整个过程:
我的工作目录:
> getwd()
[1] "P:/PROPENSITY"我使用这段代码将csv文件转换为xdf:
rx_CL_Generic_Retail_201506 <- rxImport(
inData = "CL_Generic_Retail_201506_23-05-2017.csv",
outFile = "CL_Generic_Retail_201506.xdf",
overwrite = TRUE
)然后,我使用这段代码检查转换是否成功:
rxSummary(formula = ~ Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_,
data = "CL_Generic_Retail_201506.xdf"
)
Summary Statistics Results for: ~Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_
Data: "CL_Generic_Retail_201506.xdf" (RxXdfData Data Source)
File name: CL_Generic_Retail_201506.xdf
Number of valid observations: 7155413
Name Mean StdDev Min Max ValidObs MissingObs
Avg_Deposits 4562.914627 128614.5683 -325684032 69317080.0 7155413 0
Total_Num_ 7.062068 247.1506 1 224579.0 831567 6323846
Sumof_CC_AVGBAL_ 951.484138 2249.3149 0 164746.6 601304 6554109 在那之前一切都很好。
我继续将文件转换为xdf文件。
然后,我返回到同一个文件,并尝试运行相同的函数(摘要),并得到以下错误消息:
> rxSummary(formula = ~ Avg_Deposits + Total_Num_ + Sumof_CC_AVGBAL_,
+
+ data = "CL_Generic_Retail_201506.xdf"
+
+ )
The file or directory 'CL_Generic_Retail_201506.xdf' cannot be found.如果我重复该进程并再次运行rxImport,则rxSummary函数将再次运行。但过了一段时间,同样的错误会重复出现。
,这跟反斜杠有关吗?
信息是:
The file or directory 'P:\PROPENSITY\CL_Generic_Retail_201506.xdf' cannot be found.但是,当我要求R打印工作目录时,它返回:
> getwd()
[1] "P:/PROPENSITY"请注意,在RevoScaleR错误消息中,斜杠为\,而r的getwd()输出有/。
如果这就是问题,我能做些什么?
顺便说一下,这个问题发生在安装了Windows和RevoScaleR的工作站上。在笔记本运行的同时也不出现RevoScaleR的问题。
如有任何建议,我将不胜感激。
下面是该目录的图像,很明显存在这些文件。具有xdf文件的倾向文件夹的图像
发布于 2017-07-21 14:47:58
尝试使用append =“row”。最后一个csv可能是空的,结果是用没有文件的空xdf覆盖xdf。
rx_CL_Generic_Retail_201506 <- rxImport(inData = "CL_Generic_Retail_201506_23-05-2017.csv", outFile = "CL_Generic_Retail_201506.xdf", overwrite = TRUE,
append = "rows"
)https://stackoverflow.com/questions/44162435
复制相似问题