我正在尝试将数据集导入到R中以应用线性回归模型,但我对我的代码持怀疑态度,因为我是R的新手。数据集如下所示,其中包含5000+行数据:
power consumption cputi dbsu
作为列名,并将以下整数作为其在上一列中的值:
132 25 654
我编写的调用R函数的sql代码是
CREATE COLUMN TABLE "PREDICTIVE ANALYSIS" LIKE "ANAGAPPAN.POWER_CONSUMPTION" WITH NO DATA;
SELECT POWER_APP, POWER_DB,CPUTI,DBTI,DBSU
FROM "ANAGAPPAN.POWER_CONSUMPTION";
DROP PROCEDURE USE_LM;
CREATE PROCEDURE USE_LM( IN train "ANAGAPPAN.POWER_CONSUMPTION", OUT result "PREDICTIVE ANALYSIS")
LANGUAGE
RLANG AS
BEGIN
library(lm)
model_app <- lm( POWER_APP ~ CPUTI + DBTI + DBSU + KBYTES_TRANSFERRED, data = train )
colnames(datOut) <- c("POWER_APP", "CPUTI", "DBTI", "DBSU", "DBSU")
PREDICTIVE ANALYSIS <- as.data.frame( lm(model_App))
END;发布于 2015-06-08 15:27:20
虽然我不熟悉SAP产品,但我会尝试一下我认为是在BEGIN和END;之间的R代码。
library(lm)是不正确的,就像@Olli提到的那样。要访问R的线性模型功能,您必须调用- nothing。默认情况下是通过stats包加载的(如果在--vanilla模式下调用R,则可能不是这样。
model_app <- lm( POWER_APP ~ CPUTI + DBTI + DBSU + KBYTES_TRANSFERRED, data = train )看起来没问题,至少从语法的角度看是这样的。
为
colnames(datOut) <- c("POWER_APP", "CPUTI", "DBTI", "DBSU", "DBSU")我看不出你在哪里定义了datOut。如果这个变量不是由数据库创建的,那么它就不存在,R应该会像下面这样报错
Error in colnames(notExist) <- "x" : object 'notExist' not found我将假设您想要基于模型进行预测(意味着)。线路
PREDICTIVE ANALYSIS <- as.data.frame( lm(model_App))不会工作,因为R的变量不应该有空格,as.data.frame不会在lm对象上工作,model_App不存在(请注意这种情况)。我认为你应该做一些类似的事情
# based on http://help.sap.com/hana/sap_hana_r_integration_guide_en.pdf
# you have to specify variable result which will be exported to the database
result <- as.data.frame(predict(model_app))你可以试一试。
x <- 1:10
y <- rnorm(10)
mdl <- lm(y ~ x)
as.data.frame(predict(mdl))
predict(mdl)
1 0.47866685
2 0.34418219
3 0.20969753
4 0.07521287
5 -0.05927180
6 -0.19375646
7 -0.32824112
8 -0.46272579
9 -0.59721045
10 -0.73169511https://stackoverflow.com/questions/30640193
复制相似问题