首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在熊猫中拖行但有秩序

在熊猫中拖行但有秩序
EN

Stack Overflow用户
提问于 2020-06-06 06:05:31
回答 2查看 113关注 0票数 1

假设我有一个由三列组成的数据框架:年龄、性别和国家。

我想随机地对这些数据进行洗牌,,但以一种按性别排序的方式,。男性和女性各有n个,其中n可能小于、大于或等于m。洗牌应该以这样的方式进行,这样我们就可以在8人的情况下得到以下结果:

男,女,..。(如果有更多的女性:M> n)男性、女性、男性、女性、男性(如果男性多于男性:n> m)男性、女性、男性、女性(如果男女相等:n= m)

代码语言:javascript
复制
df = pd.DataFrame({'Age': [10, 20, 30, 40, 50, 60, 70, 80],
                   'Gender': ["Male", "Male", "Male", "Female", "Female", "Male", "Female", "Female"], 
'Country': ["US", "UK", "China", "Canada", "US", "UK", "China", "Brazil"]})
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-06-06 06:30:21

首先,在每个组中添加序列号:

代码语言:javascript
复制
df['Order'] = df.groupby('Gender').cumcount()

然后分类:

代码语言:javascript
复制
df.sort_values('Order')

它给了你:

代码语言:javascript
复制
   Age  Gender Country  Order
0   10    Male      US      0
3   40  Female  Canada      0
1   20    Male      UK      1
4   50  Female      US      1
2   30    Male   China      2
6   70  Female   China      2
5   60    Male      UK      3
7   80  Female  Brazil      3

如果你想洗牌,在一开始就这样做,例如df = df.sample(frac=1),参见:Shuffle DataFrame rows

票数 2
EN

Stack Overflow用户

发布于 2020-06-06 06:34:05

使用'Sort_Column'创建两个新的数据格式,并使df_male数据为偶数值和df_female数据为奇数值。然后,使用pd.concat将它们重新组合起来,并在'Sort_Column'上使用.sort_values()

代码语言:javascript
复制
df = pd.DataFrame({'Age': [10, 20, 30, 40, 50, 60, 70, 80],
                   'Gender': ["Male", "Male", "Male", "Female", "Female", "Male", "Female", "Female"], 
'Country': ["US", "UK", "China", "Canada", "US", "UK", "China", "Brazil"]})
df['Sort_Column'] = 0
df_male = df.loc[df['Gender'] == 'Male'].reset_index(drop=True)
df_male['Sort_Column'] = df_male['Sort_Column'] + df_male.index*2
df_female = df1.loc[df1['Gender'] == 'Female'].reset_index(drop=True)
df_female['Sort_Column'] = df_female['Sort_Column'] + df_female.index*2 + 1
df_sorted=pd.concat([df_male, df_female]).sort_values('Sort_Column').drop('Sort_Column', axis=1).reset_index(drop=True)
df_sorted

输出:

代码语言:javascript
复制
    Age Gender  Country
0   10  Male    US
1   40  Female  Canada
2   20  Male    UK
3   50  Female  US
4   30  Male    China
5   70  Female  China
6   60  Male    UK
7   80  Female  Brazil
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62228008

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档