函数stats::model.matrix可用于将输入数据帧转换为适合在求解回归方程等过程中进行原始代数处理的矩阵。例如:
set.seed(0)
df <- data.frame(a = rnorm(5), n = rnorm(5))
model.matrix(~., data = df)产生:
(Intercept) a n
1 1 1.2629543 -1.539950042
2 1 -0.3262334 -0.928567035
3 1 1.3297993 -0.294720447
4 1 1.2724293 -0.005767173
5 1 0.4146414 2.404653389其中一个功能是它控制如何将截距添加到设计矩阵中。比较:model.matrix(~ 0 + ., data = df)与model.matrix(~ 1 + ., data = df)
现在,公式中的.指定应该包括df的所有变量。当我希望传递一个空的数据帧,从而只创建拦截时,这会导致一个问题,例如:
df <- data.frame(matrix(, nrow=5, ncol=0))
model.matrix(~ ., data = df)通向:
Error in terms.formula(object, data = data) :
'.' in formula and no 'data' argument有没有人知道如何解决这个问题,具体地说,除了使用.之外,我想生成以下由model.matrix(~ 1, data = df)给出的结果。
发布于 2017-02-28 08:01:44
你可以这样做:
model.matrix(as.formula(paste0("~", colnames(df), "+1", collapse="+")), data=df)但是,我认为使用if语句会更好。我认为R中的公式比任何基本的公式都更方便。
https://stackoverflow.com/questions/42497915
复制相似问题