首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >矢量化数据查找

矢量化数据查找
EN

Stack Overflow用户
提问于 2017-04-23 10:07:36
回答 2查看 172关注 0票数 2

我有两个数据:

代码语言:javascript
复制
df = pd.DataFrame([['A', 'B'], ['B', 'A']], columns=['Mon', 'Tues'])

    Mon Tues
0   A   B
1   B   A

lookup = pd.DataFrame([[0, 1], [2, 3]], index=['A', 'B'], columns=df.columns)

    Mon Tues
A   0   1
B   2   3

对于第一个dataframe中的每个键,我想在第二个dataframe中查找它的值。这是一种方法:

代码语言:javascript
复制
output = pd.DataFrame()
for col in df.columns:
    output[col] = df[col].map(lookup[col])

    Mon Tues
0   0   3
1   2   1

有没有办法在没有显式循环的情况下得到相同的答案?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-04-23 10:32:07

您可以使用replace来交换值:

代码语言:javascript
复制
>>> df.replace(lookup)
   Mon  Tues
0    0     3
1    2     1

当传递给replace方法时,DataFrames将被类似于嵌套字典。对于每个列标签,列的值映射到查找DataFrame中相应的索引值。

票数 3
EN

Stack Overflow用户

发布于 2017-04-23 10:17:37

我假设df中的每一列数据都是lookup.index的随机顺序,lookup.index是按顺序排列的。因此,下面是一个基于NumPy的矢量化解决方案,特别是使用它的advanced-indexing -

代码语言:javascript
复制
idx = np.argsort(df.values,1)
df_out = pd.DataFrame(lookup.values[idx,np.arange(idx.shape[1])],columns=df.columns)

样本输出-

代码语言:javascript
复制
In [41]: idx = np.argsort(df.values,1)

In [42]: pd.DataFrame(lookup.values[idx,np.arange(idx.shape[1])],columns=df.columns)
Out[42]: 
   Mon  Tues
0    0     3
1    2     1

如果lookup.index没有排序,我们需要做一些额外的工作-

代码语言:javascript
复制
sidx = lookup.index.argsort()
arr_out = lookup.values[idx,np.arange(idx.shape[1])][sidx]
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43569756

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档