我试图用"Revo64-9.0 -f testrxspak.R“命令执行下面的代码
list.files(system.file("SampleData", package = "RevoScaleR"))
myHadoopCluster <- RxSpark(namenode="zzz.westeurope.cloudapp.azure.com", port=8020,consoleOutput=TRUE)
rxSetComputeContext(myHadoopCluster)
file.exists(system.file("SampleData/AirlineDemoSmall.csv", package="RevoScaleR"))
bigDataDirRoot <- "/user/RevoShare" # HDFS location of the example data
rxHadoopListFiles(bigDataDirRoot) # There will be no files at this point.
source <-system.file("SampleData/AirlineDemoSmall.csv", package="RevoScaleR")
inputDir <- file.path(bigDataDirRoot,"AirlineDemoSmall")
rxHadoopMakeDir(inputDir)
rxHadoopListFiles(bigDataDirRoot)
rxHadoopCopyFromLocal(source, inputDir)
rxHadoopListFiles(inputDir)
hdfsFS <- RxHdfsFileSystem(hostName="zzz.westeurope.cloudapp.azure.com", port=8020)
colInfo <- list(DayOfWeek = list(type = "factor", levels = c("Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday")))
airDS <- RxTextData(file = inputDir, missingValueString = "M", colInfo = colInfo, fileSystem = hdfsFS)
# adsSummary <- rxSummary(~ArrDelay+CRSDepTime+DayOfWeek, data = airDS)
rxSummary(~ArrDelay:DayOfWeek, data = airDS)我发现了以下错误:
17/03/19 00:00:11警告util.NativeCodeLoader:无法为您的平台加载本机-hadoop库。使用内置-java类,其中appli$ 警告:在/log/cloudera/parcels/MRS-9.0.1/hadoop中找不到libjvm.so,搜索系统范围内 内部错误:无法在连接到hdfs文件系统时重置hdfs内部参数。 try中的错误({:内部错误:无法在连接到hdfs文件系统时重置hdfs内部参数)。 错误:try中的错误({:内部错误:无法在连接到hdfs文件系统时重置hdfs内部参数。
ScaleR库scaleR-hadoop-0.1-SNAPSHOT.jar被复制到所有节点上的文件夹中。请尽早帮我解决这个问题
发布于 2017-03-21 09:22:44
MRS使用名为/var/RevoShare的目录来执行它。一旦执行,它就会根据用户名创建文件夹,该用户名与该文件夹中的数据一起执行。
不知何故,它不是在删除旧文件。我已经手动删除了这些文件,然后开始工作。
https://stackoverflow.com/questions/42883316
复制相似问题