我想根据数据集某一列中类别的百分比对数据帧进行切片。如果我有一个类似下面这样的数据框
>> age height weight obese
28 6.7 82 0
22 5.10 67 0
18 6 77 0
19 5.2 88 1
21 5.3 89 1
24 5.9 68 0我想根据肥胖列及其类别百分比对数据进行切片。例如:
>> df_equal
age height weight obese
28 6.7 82 0
21 5.3 89 1
>> df_minority
age height weight obese
28 6.7 82 0
19 5.2 88 1
21 5.3 89 1
>> df_majority
age height weight obese
28 6.7 82 0
22 5.10 67 0
18 6 77 0
19 5.2 88 1我想要的是我提到的少数类的百分比,根据特定的列百分比对整个数据帧进行切片。例如:如果我希望列的类别百分比是50:50,那么我的数据框应该包含50%的==为0的肥胖样本和50%的==为1的肥胖样本,类似于df_equal,依此类推,表示不同的百分比
发布于 2020-09-25 20:50:36
我想要的是我提到的少数族裔的一个百分比
df['obese'].value_counts(normalize=True)https://stackoverflow.com/questions/64064466
复制相似问题