首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在单独的数据中生成值

在单独的数据中生成值
EN

Stack Overflow用户
提问于 2022-02-12 09:43:55
回答 1查看 51关注 0票数 1

我试着用Pandas生成随机数据。

数据需要存储在两列中。第一列需要包含分类变量(从Stratum_1到Stratum_19),每个层都可以包含任意数量的值。

第二列需要有介于1到180000000之间的数据,标准偏差为453210,平均值为170000,以及许多行100000。

我试着

代码语言:javascript
复制
   categorical = {'name': ['Stratum_1','Stratum_2','Stratum_3','Stratum_4','Stratum_5','Stratum_6','Stratum_7','Stratum_8','Stratum_9',
    'Stratum_10','Stratum_11','Stratum_12','Stratum_13','Stratum_14','Stratum_15','Stratum_16','Stratum_17','Stratum_18','Stratum_19']}


desired_mean = 170000
desired_std_dev = 453210

df = pd.DataFrame(np.random.randint(0,180000000,size=(100000, 1)),columns=list('1'))

我尝试使用上面的代码,但不知道如何实现分类值和数值值以及所需的均值和标准差。那么,有谁能帮助解决这个问题并产生什么呢?

EN

回答 1

Stack Overflow用户

发布于 2022-02-12 10:01:09

尝试:

代码语言:javascript
复制
import numpy as np
categorical = {'name': ['Stratum_1','Stratum_2','Stratum_3','Stratum_4','Stratum_5','Stratum_6','Stratum_7','Stratum_8','Stratum_9',
    'Stratum_10','Stratum_11','Stratum_12','Stratum_13','Stratum_14','Stratum_15','Stratum_16','Stratum_17','Stratum_18','Stratum_19']}


desired_mean = 170000
desired_std_dev = 453210

df = pd.DataFrame({'num':np.random.normal(170000, 453210,size=(300000, 1)).reshape(-1), 'cat':np.random.choice(categorical['name'], 300000)})
df[(0<df['num'])&(df['num']<180000000)].sample(100000)

结果:

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71090703

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档