我有一个如下列的df:
id
11
22
22
333
33
333此列是敏感数据。我想用任意随机数替换每个值,但是每个随机数都应该在相同的ID中保持相同的数字。
例如,我想屏蔽列中的数据,如下所示:
id
123
987
987
456
00
456注意,相同的ID具有相同的值。我怎样才能做到这一点?我有成千上万的身份证。
发布于 2022-08-28 08:42:30
我建议你这样做:
from random import randint
df['id_rand'] = df.groupby('id')['id'].transform(lambda x: randint(1,1000))
>>> df
'''
id id_rand
0 11 833
1 22 577
2 22 577
3 333 101
4 33 723
5 333 101https://stackoverflow.com/questions/73515097
复制相似问题