我有一个数据帧,其中包含Date、Source1等列名。如何从所有重复项中仅删除最后一个重复行。
Date | Source1
----------------|---------------------
3-Sep-11 | JKY
3-Sep-11 | CYK
3-Sep-11 | JKY
3-Sep-11 | JKY
3-Sep-11 | XYZ
4-Sep-11 | JKY
4-Sep-11 | CYK 我想要得到如下结果
Date | Source1
----------------|---------------------
3-Sep-11 | JKY
3-Sep-11 | CYK
3-Sep-11 | JKY
3-Sep-11 | XYZ
4-Sep-11 | JKY
4-Sep-11 | CYK 发布于 2013-06-05 18:23:04
这就是问题所在。
s = """
Date | Source1
----------------|---------------------
3-Sep-11 | JKY
3-Sep-11 | CYK
3-Sep-11 | JKY
3-Sep-11 | JKY
3-Sep-11 | XYZ
4-Sep-11 | JKY
4-Sep-11 | CYK
"""
had_duplicate = False
stack = []
for e in reversed(s.splitlines()):
if not had_duplicate and e in stack :
had_duplicate = True
continue
stack.append(e)
print('\n'.join(reversed(stack)))https://stackoverflow.com/questions/16936696
复制相似问题