文章/答案/技术大牛

发布

社区首页 >问答首页 >在单独的数据中生成值

问在单独的数据中生成值
EN

Stack Overflow用户

提问于 2022-02-12 09:43:55

回答 1查看 51关注 0票数 1

我试着用Pandas生成随机数据。

数据需要存储在两列中。第一列需要包含分类变量(从Stratum_1到Stratum_19)，每个层都可以包含任意数量的值。

第二列需要有介于1到180000000之间的数据，标准偏差为453210，平均值为170000，以及许多行100000。

我试着

   categorical = {'name': ['Stratum_1','Stratum_2','Stratum_3','Stratum_4','Stratum_5','Stratum_6','Stratum_7','Stratum_8','Stratum_9',
    'Stratum_10','Stratum_11','Stratum_12','Stratum_13','Stratum_14','Stratum_15','Stratum_16','Stratum_17','Stratum_18','Stratum_19']}


desired_mean = 170000
desired_std_dev = 453210

df = pd.DataFrame(np.random.randint(0,180000000,size=(100000, 1)),columns=list('1'))

我尝试使用上面的代码，但不知道如何实现分类值和数值值以及所需的均值和标准差。那么，有谁能帮助解决这个问题并产生什么呢？

python

pandas

numpy

回答 1

Stack Overflow用户

发布于 2022-02-12 10:01:09

尝试：

import numpy as np
categorical = {'name': ['Stratum_1','Stratum_2','Stratum_3','Stratum_4','Stratum_5','Stratum_6','Stratum_7','Stratum_8','Stratum_9',
    'Stratum_10','Stratum_11','Stratum_12','Stratum_13','Stratum_14','Stratum_15','Stratum_16','Stratum_17','Stratum_18','Stratum_19']}


desired_mean = 170000
desired_std_dev = 453210

df = pd.DataFrame({'num':np.random.normal(170000, 453210,size=(300000, 1)).reshape(-1), 'cat':np.random.choice(categorical['name'], 300000)})
df[(0<df['num'])&(df['num']<180000000)].sample(100000)

结果：

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71090703

复制

相似问题

问在单独的数据中生成值
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在单独的数据中生成值EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在单独的数据中生成值
EN