首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R中有序和无序因子变量的差异

R中有序和无序因子变量的差异
EN

Stack Overflow用户
提问于 2014-09-30 11:07:12
回答 2查看 11.3K关注 0票数 5

我一直在尝试在R中查找ordered和无序factor变量之间的区别,特别是?factor文档中的这一行让我感到困惑:

代码语言:javascript
复制
Ordered factors differ from factors only in their class, but methods and
the model-fitting functions treat the two classes quite differently.

我最接近于找到答案的是以下三个问题的答案:

  1. Factors ordered vs. levels
  2. Is there an advantage to ordering a categorical variable?
  3. factor() command in R is for categorical variables with hierarchy level only?

在对上述第一个问题的回答中,@joran说:“统计差异的详细总结可能远远超出了StackOverflow答案的范围。”

这里我不需要一个详细的总结,但是谁能给出一个简单的小例子来说明ordered和无序factor在方法和模型拟合函数中的不同之处呢?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2014-09-30 11:11:45

序因子默认使用正交多项式对比。L和Q代表线性项和二次项。无序因素使用“治疗”对比,尽管(它们实际上不是对比)。

如需理解,请阅读:http://r.789695.n4.nabble.com/Models-with-ordered-and-unordered-factors-td4072225.html http://www.stat.berkeley.edu/~s133/factors.html

票数 4
EN

Stack Overflow用户

发布于 2014-09-30 12:44:00

最容易看出的主要区别是“漂亮的印刷”。有序的因素很好地打印,在控制台,他们决定了标签的顺序在of图中。

建模方面,它们在拟合线性模型时所产生的对比是不同的。如果你想找一些简单的例子来描述这些材料,我建议你看看coding.htm。本文给出了这两种方案的两个例子: 1.虚码-无序R因子4.正交多项式编码-序R因子。

总之,在拟合模型(如性别、种族等)时,虚拟编码使用简单的水平与参考水平的比较;而多项式编码则使用趋势分析(用于收入或教育等变量)。

上述链接中的示例位于R中,因此可以很好地说明您的查询。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26119295

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档