部署用R(即.线性回归、随机森林、k均值等。)对PowerBI?
这是我目前的想法:我的响应列是column_x。我的训练集将是我的数据集中具有column_x值的所有行。我的测试集将是没有column_x值的所有行(因此需要来自ML脚本的预测值)。我会将ML脚本的输出放在PowerBI (使用编辑查询选项)中的一个新列中,用于名为pred_column_x的预测响应。
修改/填写下面的示例脚本或如何绘制的替代解决方案将非常有帮助!
谢谢!
data.df <- dataset in PowerBI
train.df <- dataset where column_x is not null??
test.df <- dataset where column_x is null??
#linear regression fit
fit <- lm(pred_column_x ~ column_a + column_b, data=train.df)
#need this fit/predicted value to go in pred_column_x
summary(fit)发布于 2020-02-04 12:48:55
最近,我正在从事一项合同工作,其中源数据只能通过PowerBI访问。我们的目标是建立一个预测模型。我是PBI的新手。由于我使用R进行所有分析,因此我编写了一个脚本并将其应用于PBI中的数据。这里有一些你必须知道的要点;
dataset。因此,将R脚本中所有dataset的匹配项都更改为dataset。edit queries,然后选择要使用的表,如所示

Transform选项卡,然后单击Run R script。Insert step上将弹出一条消息,请参见屏幕截图。
Insert按钮。这将打开Run R script编辑器窗口。注意,消息# 'dataset' holds the input data for this script (这就是我在第1点中提到的).R代码并单击OK按钮。代码将执行并给出结果。

指出
#linear regression fit fit <- lm(pred_column_x ~ column_a + column_b, data=train.df),需要保存为数据帧,如#linear regression fit fit <- data.frame(lm(pred_column_x ~ column_a + column_b, data=train.df))。显然,R的dataframe在PBI中被解释为table。
您必须单击Table才能查看结果。
免责声明
如果有人有更好的方法,请在评论中建议。
https://stackoverflow.com/questions/59565702
复制相似问题