首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >RxSpark代码执行

RxSpark代码执行
EN

Stack Overflow用户
提问于 2017-03-19 05:42:01
回答 1查看 156关注 0票数 0

我试图用"Revo64-9.0 -f testrxspak.R“命令执行下面的代码

代码语言:javascript
复制
list.files(system.file("SampleData", package = "RevoScaleR"))
myHadoopCluster <- RxSpark(namenode="zzz.westeurope.cloudapp.azure.com", port=8020,consoleOutput=TRUE)
rxSetComputeContext(myHadoopCluster)
file.exists(system.file("SampleData/AirlineDemoSmall.csv", package="RevoScaleR"))
bigDataDirRoot <- "/user/RevoShare" # HDFS location of the example data
rxHadoopListFiles(bigDataDirRoot) # There will be no files at this point.
source <-system.file("SampleData/AirlineDemoSmall.csv", package="RevoScaleR")
inputDir <- file.path(bigDataDirRoot,"AirlineDemoSmall")
rxHadoopMakeDir(inputDir)
rxHadoopListFiles(bigDataDirRoot)
rxHadoopCopyFromLocal(source, inputDir)
rxHadoopListFiles(inputDir)
hdfsFS <- RxHdfsFileSystem(hostName="zzz.westeurope.cloudapp.azure.com", port=8020)
colInfo <- list(DayOfWeek = list(type = "factor", levels = c("Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday")))
airDS <- RxTextData(file = inputDir, missingValueString = "M", colInfo  = colInfo, fileSystem = hdfsFS)
# adsSummary <- rxSummary(~ArrDelay+CRSDepTime+DayOfWeek, data = airDS)
rxSummary(~ArrDelay:DayOfWeek, data = airDS)

我发现了以下错误:

17/03/19 00:00:11警告util.NativeCodeLoader:无法为您的平台加载本机-hadoop库。使用内置-java类,其中appli$ 警告:在/log/cloudera/parcels/MRS-9.0.1/hadoop中找不到libjvm.so,搜索系统范围内 内部错误:无法在连接到hdfs文件系统时重置hdfs内部参数。 try中的错误({:内部错误:无法在连接到hdfs文件系统时重置hdfs内部参数)。 错误:try中的错误({:内部错误:无法在连接到hdfs文件系统时重置hdfs内部参数。

ScaleR库scaleR-hadoop-0.1-SNAPSHOT.jar被复制到所有节点上的文件夹中。请尽早帮我解决这个问题

EN

回答 1

Stack Overflow用户

发布于 2017-03-21 09:22:44

MRS使用名为/var/RevoShare的目录来执行它。一旦执行,它就会根据用户名创建文件夹,该用户名与该文件夹中的数据一起执行。

不知何故,它不是在删除旧文件。我已经手动删除了这些文件,然后开始工作。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42883316

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档