在Hastie等人的著名著作“统计学习的要素”中,作者将无序的范畴变量描述为定性变量/名义变量/因子。
我想知道,其他统计学家是否严格遵循这一原则,或者有些作者可以使用这些术语(定性变量/名义变量/因素)不仅适用于无序的范畴变量,也适用于有序的范畴变量?
发布于 2019-11-18 21:43:28
统计编程语言R使用了术语“有序因子”,所以因子不是完全安全的,尽管我找不到一个没有形容词的序数变量叫做" factor“的例子。
我认为序数变量通常被认为是定性的或定量的:它们具有排序的定量感觉,但缺乏数学运算。关于一些例子,请看这篇文章的结尾。
但“名义”似乎相对安全,因为它只意味着无序。(我发现了一个与此相矛盾的地方,即https://www.mymarketresearchmethods.com/types-of-data-nominal-ordinal-interval-ratio/的奖金备注2,但这与下一节中的“序号”一词相矛盾吗?)
也请参阅https://en.wikipedia.org/wiki/Level_的_量测,特别是列出其他几个建议的“辩论”部分。(Chrisman的建议很好地包含了“循环”特性,这些特性在ML中有时很重要,但如果没有一些不忠编码,则不适合大多数标准库。)
有几个链接可以显示线条变得模糊:
https://stats.stackexchange.com/q/159902/232706
https://www.mymarketresearchmethods.com/data-types-in-statistics/
https://stats.stackexchange.com/a/158226/232706
https://web.ma.utexas.edu/users/mks/statmistakes/ordinal.html
https://datascience.stackexchange.com/questions/63364
复制相似问题