我有两个不同的数据格式,一个是日期组合,另一个是城市对:
df_date_combinations:
+-------------------+-------------------+
| fs_date| ss_date|
+-------------------+-------------------+
|2022-06-01T00:00:00|2022-06-02T00:00:00|
|2022-06-01T00:00:00|2022-06-03T00:00:00|
|2022-06-01T00:00:00|2022-06-04T00:00:00|
+-------------------+-------------------+城市配对:
+---------+--------------+---------+--------------+
|fs_origin|fs_destination|ss_origin|ss_destination|
+---------+--------------+---------+--------------+
| TLV| NYC| NYC| TLV|
| TLV| ROM| ROM| TLV|
| TLV| BER| BER| TLV|
+---------+--------------+---------+--------------+我希望将它们结合在一起,这样我就可以得到以下数据:
+----------+----------+---------+--------------+---------+--------------+
| fs_date| ss_date|fs_origin|fs_destination|ss_origin|ss_destination|
+----------+----------+---------+--------------+---------+--------------+
|2022-06-01|2022-06-02| TLV| NYC| NYC| TLV|
|2022-06-01|2022-06-03| TLV| NYC| NYC| TLV|
|2022-06-01|2022-06-04| TLV| NYC| NYC| TLV|
|2022-06-01|2022-06-02| TLV| ROM| ROM| TLV|
|2022-06-01|2022-06-03| TLV| ROM| ROM| TLV|
|2022-06-01|2022-06-04| TLV| ROM| ROM| TLV|
|2022-06-01|2022-06-02| TLV| BER| BER| TLV|
|2022-06-01|2022-06-03| TLV| BER| BER| TLV|
|2022-06-01|2022-06-04| TLV| BER| BER| TLV|
+----------+----------+---------+--------------+---------+--------------+谢谢!
发布于 2022-07-21 21:30:06
听起来像是交叉连接。
df1.crossJoin(df2)发布于 2022-07-21 21:33:59
熊猫实际上有内置的方法来做这件事,我们用concat来连接数据。你可以在这里读到如何做到这一点:
与你有关的部分是:
pd.concat([df_date_combinations, city_pairs], axis = 1)希望这能有所帮助!
https://stackoverflow.com/questions/73072263
复制相似问题