给出一个按年查看人口的简化示例时间序列
Year<-c(2001,2002,2003,2004,2005,2006)
Pop<-c(1,4,7,9,20,21)
DF<-data.frame(Year,Pop)就年份之间的变化/哪些年份彼此之间存在显着差异而言,检验显著性的最佳方法是什么?
发布于 2013-02-10 12:39:11
正如@joran提到的,这实际上是一个统计问题,而不是一个编程问题。您可以尝试在http://stats.stackexchange.com上请求获取更多统计专业知识。
然而,简而言之,两种方法立即浮现在脑海中:
lm(),就像这样的lmPop <- lm(Pop ~ Year,data=DF)。t.test(Pop[1:3],Pop[4:6]).这两种方法都存在一些潜在的困难,每种方法的有效性都取决于您正在检查的数据的性质。然而,对于样本数据,第一种方法表明,随着时间的推移,在95%的置信度水平(斜率系数的p=0.00214)上似乎有一种趋势,而第二种方法表明,在95%的置信度水平上,均值没有差异的零假设不能被证伪(p = 0.06332)。
发布于 2013-02-10 17:12:43
它们彼此之间都有很大的不同。1与4显著不同,4与7显著不同,以此类推。
等等,这不是你的意思?好了,这就是你给我们的所有信息。作为一名统计学家,我不能做更多的工作。
所以现在你告诉我们一些其他的事情。“这些值中有没有显著不同于Pop值变化的直线,其中Pop值的变化是均值为0且方差相同的独立正态分布值?”或者别的什么。
简单地说,仅仅是一堆数字不能作为统计分析的对象。与统计学家合作,您需要就数据的模型达成一致,然后统计方法可以回答有关重要性和不确定性的问题。
我认为这通常是非统计学家所不能理解的。他们会问“这是我的数字,这有意义吗?”--这通常意味着在SPSS中输入它们并得到一个p值。
我已将此Q标记为要转移到它所属的stats.stackexchange.com
https://stackoverflow.com/questions/14794568
复制相似问题