首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用R检验时间序列中的显著性

使用R检验时间序列中的显著性
EN

Stack Overflow用户
提问于 2013-02-10 11:59:45
回答 2查看 6.6K关注 0票数 0

给出一个按年查看人口的简化示例时间序列

代码语言:javascript
复制
Year<-c(2001,2002,2003,2004,2005,2006)
Pop<-c(1,4,7,9,20,21)
DF<-data.frame(Year,Pop)

就年份之间的变化/哪些年份彼此之间存在显着差异而言,检验显著性的最佳方法是什么?

EN

回答 2

Stack Overflow用户

发布于 2013-02-10 12:39:11

正如@joran提到的,这实际上是一个统计问题,而不是一个编程问题。您可以尝试在http://stats.stackexchange.com上请求获取更多统计专业知识。

然而,简而言之,两种方法立即浮现在脑海中:

  1. 如果你将一条回归线拟合到人口与年份的关系,并且有一个统计上显着的斜率,这将表明多年来人口的总体趋势,即在R中使用lm(),就像这样的lmPop <- lm(Pop ~ Year,data=DF)
  2. 您可以将时间段划分为多个区块(例如,前三年和最后三年),并假设每个区块中年份的人口数字都是对该区块中的平均人口的估计。这将为您提供每个年份的总体的平均值和标准差,这将允许您进行t检验,例如:t.test(Pop[1:3],Pop[4:6]).

这两种方法都存在一些潜在的困难,每种方法的有效性都取决于您正在检查的数据的性质。然而,对于样本数据,第一种方法表明,随着时间的推移,在95%的置信度水平(斜率系数的p=0.00214)上似乎有一种趋势,而第二种方法表明,在95%的置信度水平上,均值没有差异的零假设不能被证伪(p = 0.06332)。

票数 6
EN

Stack Overflow用户

发布于 2013-02-10 17:12:43

它们彼此之间都有很大的不同。1与4显著不同,4与7显著不同,以此类推。

等等,这不是你的意思?好了,这就是你给我们的所有信息。作为一名统计学家,我不能做更多的工作。

所以现在你告诉我们一些其他的事情。“这些值中有没有显著不同于Pop值变化的直线,其中Pop值的变化是均值为0且方差相同的独立正态分布值?”或者别的什么。

简单地说,仅仅是一堆数字不能作为统计分析的对象。与统计学家合作,您需要就数据的模型达成一致,然后统计方法可以回答有关重要性和不确定性的问题。

我认为这通常是非统计学家所不能理解的。他们会问“这是我的数字,这有意义吗?”--这通常意味着在SPSS中输入它们并得到一个p值。

我已将此Q标记为要转移到它所属的stats.stackexchange.com

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14794568

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档