我试图执行数据清理,我遇到了困难,我遇到了解决方案,我想迭代熊猫的数据,以便我可以更新这些行下的字符串“未指定”的资格栏。
我想用“学士学位、研究生文凭、专业学位”或“学士学位、研究生文凭、专业学位、硕士学位”分别代替“学士学位、研究生文凭、专业学位和硕士学位”,这分别取决于硕士学位、学位栏条件是否表示1?
例:如果学位栏和硕士栏都有1,则改为学士学位,研究生文凭、专业学位、硕士学位(如果学位栏有1)改为学士学位、研究生文凭、专业学位。
我怎样才能做到这一点?以下是我希望取得的成果的附件。

发布于 2022-10-05 11:24:05
您可以定义匹配特定条件的不同标准,并将它们组合起来以定义复杂条件。然后使用.loc更新数据格式。
我提供了下面的样本。它假设数据保存在名为df的数据中。当列“qual”包含“未指定”,列“母版”包含1时,它会用“MyDegree”更新列'qual‘。你可以用任何你想要的东西来代替它。根据需要创建尽可能多的条件,并使用和/或形成复杂的条件。
criteria1 = df['qual'] == 'not specified'
criteria2 = df['masters'] == 1
criteria_all = criteria1 & criteria2
df.loc[criteria_all, 'qual'] = 'MyDegree'https://stackoverflow.com/questions/73958705
复制相似问题