文章/答案/技术大牛

发布

问世代数
EN

Stack Overflow用户

提问于 2022-09-24 17:38:11

回答 3查看 44关注 0票数 1

我试图随机生成数据。下面你可以看到我的例子

import numpy as np
import pandas as pd
import random

df_categories = pd.DataFrame(np.random.choice(a=["0", "1"], size=100, p=[0.7, 0.3]),
columns = ['number'])
df_categories

此代码运行良好并生成数据。现在，我想更改这段代码，以便在某个范围内生成整数数据，而不是"1"，以生成来自1 to 100的范围内的数据。

df_categories = pd.DataFrame(np.random.choice(a=[0, random.randint(0, 100)], size=100, p=[0.7, 0.3]),
columns = ['number'])
df_categories

我尝试了上面的代码，但是这段代码在30%的字段中只生成一个值。所以，有人能帮我解决这个问题，产生不同的数字而不是一个数字吗？

python

pandas

numpy

回答 3

Stack Overflow用户

回答已采纳

发布于 2022-09-24 17:41:20

你为什么不使用numpy.random.randint和面罩呢？

# random integers
a = np.random.randint(0, 100, size=100)
# random mask for ~70% of values
m = np.random.choice([True, False], size=100, p=[0.7, 0.3])

df_categories = pd.DataFrame(np.where(m, 0, a),
                             columns=['number'])
df_categories

票数 2

Stack Overflow用户

发布于 2022-09-24 17:54:45

您可以执行以下操作：

n = 100
prob_0 = 0.7
a = [0] + list(np.arange(0, n)) # [0, 0, 1, 2, 3, ..., 99]
p = [prob_0] + [(1 - prob_0)/n] * n # [0.7, 0.003, ..., 0.003]
df_categories = pd.DataFrame(np.random.choice(a=a, size=n, p=p), columns=['number'])

产出(例如)：

    number
0        0
1       32
2        0
3       39
4        0
..     ...
95       0
96      63
97      55
98       0
99       0

[100 rows x 1 columns]

票数 2

Stack Overflow用户

发布于 2022-09-24 18:04:23

你需要这个：

import pandas as pd
import numpy as np
import random

my_range=100

df_categories = pd.DataFrame(np.random.choice(a=[0] + list(np.arange(0, my_range)), size=100, p=[0.7] + [(0.3/my_range )]*my_range),
columns = ['number'])
df_categories

输出：

  number
0   0
1   8
2   40
3   73
4   0
... ...
95  75
96  94
97  4
98  0
99  25
100 rows × 1 columns

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/73839333

复制

相似问题

问世代数
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问世代数EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问世代数
EN