import statsmodels.api as sm
import numpy as np
import pandas as pd
import seaborn as sns

n_trials = 100
balanced = {
    True: (100, 100),
    False: (190, 10),
}
effect = 2.0
res = []
for i in range(n_trials):
    np.random.seed(i)
    noise = np.random.normal(size=sum(balanced))
    for is_balanced, ratio in balanced.items():
        t = np.array([0]*ratio[0] + [1]*ratio[1])
        y = effect * t + noise
        m = sm.OLS(y, t).fit()
        res.append((is_balanced, m.params[0], m.bse[0]))

res = pd.DataFrame(res, columns=["is_balanced", "beta", "se"])
g = sns.jointplot(
    x="se", y="beta",
    hue="is_balanced",
    data=res
)
# Annotate the true effect:
g.fig.axes[0].axhline(y=effect, color='grey', linestyle='--')
g.fig.axes[0].text(y=effect, x=res["se"].max(), s="True effect")

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/70279734

复制

相似问题

问因果推理，其中治疗分配是随机的
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问因果推理，其中治疗分配是随机的EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问因果推理，其中治疗分配是随机的
EN