首先,对不起,如果这不是问的合适的地方,但我一直在尝试创建一些虚拟变量,以便运行学生t-测试以及韦尔奇t-测试,然后运行monte-carlo simulation.Problem is,我只得到两个群体的样本大小和标准差。我如何为这些数据创建某种类型的表示,以便运行这些测试?我希望在python或R.中运行这些测试,谢谢。
编辑:两个种群都来自正态分布。
发布于 2020-05-05 11:14:37
在Python中,要从某个发行版中生成随机数,您可以从np.random (文档)中选择相应的发行版,并传递相应的参数。因此,要从正态分布中提取数据,您可以这样做。
import numpy as np
# for reproducible results, seed the number generator
np.random.seed(42)
n = 100
mu_1, std_1 = 0, 1
mu_2, std_2 = 0.2, 1.5
dataset1 = np.random.normal(loc=mu_1, scale=std_1, size=n)
dataset2 = np.random.normal(loc=mu_2, scale=std_2, size=n)以及输出
print('dataset 1:')
print(f'mean: {dataset1.mean():.2f}')
print(f'std: {dataset1.std():.2f}')
print(f'shape: {dataset1.shape}')
print('--------------')
print('dataset 2:')
print(f'mean: {dataset2.mean():.2f}')
print(f'std: {dataset2.std():.2f}')
print(f'shape: {dataset2.shape}')
--------------
dataset 1:
mean: -0.10
std: 0.90
shape: (100,)
--------------
dataset 2:
mean: 0.23
std: 1.42
shape: (100,)PS:您不必使用np.random.seed,这只是为了使随机生成器在每次运行代码时都与输出保持一致。
编辑:另外,如果您想在python上使用t-test,您可以使用scipy.stats,因此,如果您想要计算两个独立样本的平均值的t-测试,则使用scipy.stats.ttest_ind,或者如果您想要计算对两个相关样本的t-测试,则使用scipy.stats.ttest_rel。
https://datascience.stackexchange.com/questions/73587
复制相似问题