首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >多因素水平均值与观测值的r t检验

多因素水平均值与观测值的r t检验
EN

Stack Overflow用户
提问于 2015-08-23 09:51:37
回答 1查看 164关注 0票数 0

我有一个大约39k行数据的数据集,摘录如下:

  • “国家”、“团体”、“项目”、“年份”是明确的
  • “生产”和“废物”是数字。
  • “of”也是数字,但是“废物”/“生产”的结果。 区域国家组项目年生产废物如果欧洲保加利亚谷物小麦1961 2040 274 0.134313725欧洲保加利亚谷物小麦1962年2090 262 0.125358852欧洲保加利亚谷物小麦1963年1894 277 0.14625132欧洲保加利亚谷物小麦1964年2121 286 0.134842056欧洲保加利亚谷物小麦1965年2923 341 0.116660965欧洲保加利亚谷物小麦1966年3193 385 0.120576261欧洲保加利亚谷类大麦1961 612 15 0.024509804欧洲保加利亚谷物大麦1962年599 16 0.026711185保加利亚谷物大麦1963年618 16 0.025889968欧洲保加利亚谷物大麦1964年764 21 0.027486911欧洲保加利亚谷物大麦1965年876 22 0.025114155保加利亚谷物大麦1966年1064 24 0.022556391

我使用了以下代码按项和组生成991种不同的方法

代码语言:javascript
复制
df2 <- aggregate(LF ~ Country + Item, data=df1, FUN='mean')

这个函数的结果看起来很好。

我想测试一下,在df2中,LF的各个方法是否与每个国家项目组合(即df1 )中的基本年度观测值不同。如果是假的,那么LF实际上只是一个静态比率,如果是真的,那么‘废物’是独立于‘生产’)。

如何才能最好地做到这一点?仅针对这个数据集似乎就需要进行991个测试,我不知道如何以这种方式混合applyt.test函数。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2015-08-23 13:19:04

t.test需要两组来比较与数值/比例尺相关的输出变量。在这里,在我看来,每个国家和项目的组合,你想比较所有不同的年平均数/平均数。换句话说,您正在试图调查年份是否影响国家和项目的每一个组合的LF平均值。

最简单的方法是为国家和项目的每个组合创建一个线性模型(LF ~年份),并解释变量年的系数和p值。

代码语言:javascript
复制
library(dplyr)
library(broom)

set.seed(115)

# example dataset
dt = data.frame(Country = rep("country1",12),
                Item = c(rep("item1",6), rep("item2",6)),
                Year = rep(1961:1966,2),
                LF = runif(12,0,1))

# general means by country and item
dt %>% group_by(Country,Item) %>% summarise(Mean_LF = mean(LF))

# each years means by country and item
dt %>% group_by(Country,Item,Year) %>% summarise(Mean_LF = mean(LF))

# does year influence the means for each country and item?
dt %>% group_by(Country,Item) %>% do(tidy(lm(LF~Year, data=.)))

希望这能有所帮助。如果我遗漏了什么,请告诉我,我会更新我的代码。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32165328

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档