我正在构建一个推荐系统,我正在为该系统构建一个联想表,以了解产品之间的关联。
我的权变表如下所示,比方说Tble-1:
a b c d
a 2 1 1 1
b 1 2 2 0
c 1 2 2 0
d 1 0 0 1 这是一个熊猫数据帧。
由于我正在处理流数据,因此每当我获得新数据时,我都需要更新此列联表。
假设我得到了新的列联表,比方说表2:
a b c e
a 2 1 1 4
b 1 1 2 0
c 1 2 4 2
e 1 3 0 4 我需要添加两个联想表,即Table-1 + Table-2,其结果是一个新的表,如下所示:
a b c d e
a 4 2 2 1 4
b 2 3 4 0 0
c 2 4 6 1 4
d 1 0 0 1 0
e 1 3 0 0 4我如何在python pandas中实现这一点?
发布于 2019-03-13 21:50:54
对于不匹配的值,使用带有参数fill_value=0的DataFrame.add,然后替换不存在的值并转换为整数,如有必要:
df = df1.add(df2, fill_value=0).fillna(0).astype(int)
print (df)
a b c d e
a 4 2 2 1 4
b 2 3 4 0 0
c 2 4 6 0 2
d 1 0 0 1 0
e 1 3 0 0 4https://stackoverflow.com/questions/55143278
复制相似问题