背景
为了教学目的,我使用模拟(主要是在R)帮助学生(在社会science...no数学或统计背景)掌握一些“强硬”的概念/想法背后的一些统计主题。我计划讲授关于独立的齐平方测试,并准备了一个小的2x2应急表,它将性别(M和F两级)与政治派别(两个级别: PartyA、PartyB)交叉列出。在这个玩具数据集中,存在着明显的依赖性。
目标我想到了
为了帮助学生理解在零假设下的x-平方统计量的抽样分布,我想模拟一个上述两个变量都是独立的群体。我想这样做是为了:(1)可以随机抽取一个随机样本,交叉列出这两个变量,并表明气-平方检验不显着;(2)我可以绘制B随机样本,计算卡方统计量B次,并绘制出这些B卡方值的频率分布直方图(这应该代表在零假设下chi-sq的抽样分布)。
,我需要帮助,
我想不出一种方法来模拟这两个分类变量是独立的种群。理想情况下,我想提出一个包含多行和两列的数据格式:每一行代表一个观察(在我们的例子中是个人),而每一列将存储(对于每个观察)被分析的每个分类变量的级别(即性别和政治派别)。
发布于 2022-04-02 09:27:05
您可以使用sample和replace =参数集作为TRUE,并将新的向量与data.frame组合成变量。
dat <- data.frame(gender = sample(c("F", "M"), size = 1000, replace = TRUE),
party = sample(c("Party A", "Party B"), size = 1000, replace = TRUE))因为这两个变量是分开生成的,所以它们不会相互关联。
https://stackoverflow.com/questions/71716220
复制相似问题