文章/答案/技术大牛

发布

社区首页 >问答首页 >如何根据Pandas中第二个数据帧中的几个列合并两个数据帧？

问如何根据Pandas中第二个数据帧中的几个列合并两个数据帧？
EN

Stack Overflow用户

提问于 2021-10-16 21:32:05

回答 2查看 102关注 0票数 1

我在Python中有两个Pandas数据框架，如下所示：

df1

ID
----
11
22
33
44

df2

ID1   ID2   ID3
--------------------
11  | 5   | 114
88  | 22  | 18
99  | 45  | 33

df1在两种数据帧中都有比df2
更多的值类型是int

。

我需要做一些事情，比如df1 LEFT JOIN df2，使用来自df1的"ID“和来自df2的"ID1”、"ID2“、"ID3”与df2合并

合并ID上的数据帧(df1)和ID1 (Df2)
，如果ID不与ID1 ->合并，则在ID上合并ID2
，如果ID不与ID2->合并，则ID3
给出123456如果行不合并

G 217

因此，我需要下面这样的东西：

ID    ID1   ID2   ID3
--------------------------
11  | 11     | 5       | 114
22  | 88     | 22      | 18
33  | 99     | 45      | 33
44  | 123456 | 123456  | 123456

我怎么能在Python Pandas中做到这一点呢？我完全不知道。

dataframe

merge

python

pandas

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-10-16 22:15:07

您可以将df2堆栈为df2a，然后左加入df1和df2a，然后左加入与原始索引匹配的原始df2。使用NaN填充123456并删除中间列以获得所需的输出：

df2a = df2.stack().reset_index(name='ID')

df_out = (df1.merge(df2a, on='ID', how='left')
             .merge(df2, left_on='level_0', right_index=True, how='left')
             .fillna(123456, downcast='infer')
             .drop(['level_0', 'level_1'], axis=1)
         )

或者用.join简化第二个.join(感谢@HenryEcker的建议)，如下所示：

df2a = df2.stack().reset_index(name='ID')

df_out = (df1.merge(df2a, on='ID', how='left')
             .join(df2, on='level_0')
             .fillna(123456, downcast='infer')
             .drop(['level_0', 'level_1'], axis=1)
         )

结果：

print(df_out)

   ID     ID1     ID2     ID3
0  11      11       5     114
1  22      88      22      18
2  33      99      45      33
3  44  123456  123456  123456

分解步骤：

print(df2a)

   level_0 level_1   ID
0        0     ID1   11
1        0     ID2    5
2        0     ID3  114
3        1     ID1   88
4        1     ID2   22
5        1     ID3   18
6        2     ID1   99
7        2     ID2   45
8        2     ID3   33

票数 2

Stack Overflow用户

发布于 2021-10-16 21:45:45

你应该看看这里(https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html)，你有很多不同的想法。例如：

import pandas as pd

df1 = pd.DataFrame(
    {
        "A": ["A0", "A1", "A2", "A3"],
        "B": ["B0", "B1", "B2", "B3"],
        "C": ["C0", "C1", "C2", "C3"],
        "D": ["D0", "D1", "D2", "D3"],
    }
)


df2 = pd.DataFrame(
    {
        "A": ["A4", "A5", "A6", "A7"],
        "B": ["B4", "B5", "B6", "B7"],
        "C": ["C4", "C5", "C6", "C7"],
        "D": ["D4", "D5", "D6", "D7"],
    }
)


df3 = pd.DataFrame(
{
    "A": ["A8", "A9", "A10", "A11", "A12"],
    "B": ["B8", "B9", "B10", "B11", "B12"],
    "C": ["C8", "C9", "C10", "C11", "C12"],
    "D": ["D8", "D9", "D10", "D11", "D12"],
}
)
df = pd.concat([df1, df2, df3], axis=1)

给你：

     A    B    C    D    A    B    C    D    A    B    C    D
0   A0   B0   C0   D0   A4   B4   C4   D4   A8   B8   C8   D8
1   A1   B1   C1   D1   A5   B5   C5   D5   A9   B9   C9   D9
2   A2   B2   C2   D2   A6   B6   C6   D6  A10  B10  C10  D10
3   A3   B3   C3   D3   A7   B7   C7   D7  A11  B11  C11  D11
4  NaN  NaN  NaN  NaN  NaN  NaN  NaN  NaN  A12  B12  C12  D12

所以，在你的例子中：

df1 = pd.DataFrame(
    {
        "ID": [11, 22, 33, 44]
    }
)


df2 = pd.DataFrame(
    {
        "ID1": [11, 88, 99],
        "ID2": [5, 22, 45],
        "ID3": [114, 18, 33]
    }
)


df = pd.concat([df1, df2], axis=1)
df.fillna('123456', inplace=True) # to replace NaNs with the values you want

给予：

   ID     ID1     ID2     ID3
0  11    11.0     5.0   114.0
1  22    88.0    22.0    18.0
2  33    99.0    45.0    33.0
3  44  123456  123456  123456

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69599695

复制

相似问题

问如何根据Pandas中第二个数据帧中的几个列合并两个数据帧？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何根据Pandas中第二个数据帧中的几个列合并两个数据帧？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何根据Pandas中第二个数据帧中的几个列合并两个数据帧？
EN