问为什么我在回归总结中丢失了分类数据？
EN

Stack Overflow用户

提问于 2021-04-29 08:45:22

回答 1查看 285关注 0票数 0

box <- read.csv("BlackBoxtrainApril22.csv")

#Change the 2 categorical variables into factors
box$SOUND <- as.factor(box$SOUND)
box$SWITCH <- as.factor(box$SWITCH)

#divide training and testing data
train <- box[1:12000,]
test <- box[12001:18048,]

library(nnet)
require(nnet)
multinom_model <- multinom(SOUND ~ ., data=box)
summary(multinom_model)

下面是dput(head(box))的一些输出，用于查看数据的外观：

structure(list(ID = c(86623L, 57936L, 54301L, 2678L, 65827L, 22420L), INPUT1 = c(30L, 87L, 16L, 64L, 33L, 5L), INPUT2 = c(31L, 76L, 33L, 77L, 72L, 50L), INPUT3 = c(72L, 31L, 87L, 91L, 53L, 26L), INPUT4 = c(29L, 79L, 41L, 59L, 66L, 50L), SWITCH = c("Low", "Low", "Low", "Minimum", "High", "High"), SOUND = c("Gargle", "Tick", "Tick", "Beep", "Beep", "Gargle")), row.names = c(NA, 6L), class = "data.frame")

本质上，我试图使用数字和分类数据的组合来预测分类变量。这是我的代码。当我做摘要时，我丢失了一个SWITCH类别和一个SOUND类别。我认为这与引用变量有关，但我不是很确定。

r-faq

regression

dummy-variable

回答 1

Stack Overflow用户

发布于 2021-04-29 08:49:59

你对引用类别的看法是对的。当您在模型中包含类别/因子变量时，该变量的一个类别将始终被排除，并用作参考类别。您do在输出中看到的类别的估计值是引用被排除的类别的。例如，如果您有一个类别为“红色”、“蓝色”和“绿色”的因子变量，而“红色”是参考类别，那么“蓝色”和“绿色”的模型估计将分别是“蓝色”与“红色”和“绿色”与“红色”。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67309639

复制

相似问题

问为什么我在回归总结中丢失了分类数据？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么我在回归总结中丢失了分类数据？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为什么我在回归总结中丢失了分类数据？
EN