文章/答案/技术大牛

发布

社区首页 >问答首页 >R包:在添加第二个可解释性变量后，fit更差。

问R包:在添加第二个可解释性变量后，fit更差。
EN

Stack Overflow用户

提问于 2014-02-05 01:03:45

回答 1查看 159关注 0票数 0

为什么在添加第二个解释变量之后，fit会变得更糟？

require("VGAM")
df = data.frame(x = c(1,2,3,4,5,6,7,8,9,10), y = c(1,4,8,15,25,36,48,65,80,105), z =        c(0,0,0,1,100,400,900,1600,1800,200)  )
vgt1 = vgam(y~s(x, df=2), data=df,family=gaussianff, trace=TRUE)
vgt2 = vgam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)

plot(df$x, df$y, col="black")
lines(df$x, vgt1@predictors, col="red")
lines(df$x, vgt2@predictors, col="blue")

spline

data-fitting

vgam

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-02-05 02:22:46

当您添加一个变量时，您使用的是+而不是cbind。

vgam使用terms.formula解析公式以查找specials = 's'，即用s包装的表示样条的术语。

因此

vgt2 = vgam(y~s(x, df=2)+s(z, df=2), data=df,family=gaussianff, trace=TRUE)

会给你你想要的(这比vgt1有一个较低的偏差)。

当你适合的时候

vgt2 = vgam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)

terms.formula没有找到以s开头的任何specials，因为cbind是标识公式中的术语的函数。因此

gam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)

等于

gam(y~cbind(x,y), data=df,family=gaussianff, trace=TRUE)

在术语上相当于

vgam(y~x+z, data=df,family=gaussianff, trace=TRUE)

即不拟合样条项。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/21566731

复制

相似问题

问R包:在添加第二个可解释性变量后，fit更差。
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R包:在添加第二个可解释性变量后，fit更差。EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R包:在添加第二个可解释性变量后，fit更差。
EN