我正在对植被进行光谱分析,并正在寻找哪个是最重要的波长,以便进行一些遥感。
然而,我有2000个波长,所以我需要找到一种快速运行ANOVA的方法,我已经读到了一个4循环(或只是循环),这意味着我可以更快地进行这一操作,而不必逐个进行。
目前我的R代码是:
mod_structure1 <- lm(X350 ~ structure, data=mydata)
mod_structure1
summary(mod_structure1)
boxplot(X350 ~ structure, data=mydata, xlab="blah", ylab="350nm")
anova(mod_structure1)其中X350的波长为350 of。
我真的很感谢一些帮助-我的R知识不是很好,所以如果这不是真的有意义的话,我很抱歉。
发布于 2014-02-04 18:44:27
lapply比for循环更快,也做了同样的事情:
首先定义一个带有波长名称的向量。准确地做到这一点是困难的,因为您没有包括示例数据。
wavs <- c("X350", "X...", "X...",...)由于您有如此多的波长,您可能不想手动执行此操作。包括一个数据示例,这样建议起来更容易,但是假设它们是数据框中的列(来自X350的猜测):
require(reshape2)
wavdata <- melt(mydata, id = "structure")
wavs <- levels(wavdata$variable)然后,您可以继续执行该循环:
mods <- lapply(wavs, function(i) {
x <- subset(wavdata, variable == wavs)
mod_structure1 <- lm(variable ~ value, data=x)
anova(mod_structure1)})这给了你一个令人难以置信的ANOVA列表,所以要准备好。将相关参数从这些ANOVA中获取到data.frame可能会更好,这样更容易处理。
mod.data <- lapply(wavs, function(i) {
x <- subset(wavdata, variable == wavs)
mod_structure1 <- lm(variable ~ value, data=x)
tmp <- anova(mod_structure1)
data.frame(Df = tmp$Df[[1]], F = tmp$F[[1]], p = tmp$P[[1]])
})
do.call(rbind, mod.data)代码未经过测试,可能包含错误。但是,您可以从它背后的想法生成自己的想法。
https://stackoverflow.com/questions/21549151
复制相似问题