我有两个不同列的数据文件:
DF A - DF B -
number | a | b | c |||| a | c | d | e | f
1 | 12 | 13 | 15 |||| 22 | 33 | 44 | 55 | 77我想为这两个数据格式添加缺少的列,这样每个列都有,每个列都有自己的列+其他列(没有列“数字”)。新列将有初始编号供我们选择(比方说)。
所以最后的输出:
DF A -
number | a | b | c | d | e | f
1 | 12 | 13 | 15 | 0 | 0 | 0
DF B -
a | b | c | d | e | f
22 | 0 | 33 | 44 | 55 | 77实现这一结果的最佳方法是什么?我搞砸了列,并试图创建新的列。
谢谢!
发布于 2021-02-06 09:55:00
首先,您需要创建所有列的超集,这些列都存在于两个数据文件中。这可以使用下面的代码来完成。
all_columns = list(set(A.columns.to_list() + B.columns.to_list()))然后,对于每个数据文件,您需要检查哪些列丢失了,可以使用下面的代码执行。
col_missing_from_A = [col for col in all_columns if col not in A.columns]
col_missing_from_B = [col for col in all_columns if col not in B.columns]然后在两个数据文件中添加缺少的列。
A[col_missing_from_A] = 0
A[col_missing_from_B] = 0希望这能解决你的疑问!
https://stackoverflow.com/questions/66075388
复制相似问题