文章/答案/技术大牛

发布

社区首页 >问答首页 >获取数据中最大值的(行、列)指标

问获取数据中最大值的(行、列)指标
EN

Stack Overflow用户

提问于 2015-04-08 02:37:18

回答 3查看 983关注 0票数 0

我有一个像这样的数据框架。

import pandas as pd
data = [[5, 7, 10], [7, 20, 4,], [8, 1, 6,]]
cities = ['Boston', 'Phoenix', 'New York']
df = pd.DataFrame(data, columns=cities, index=cities)

输出：

         Boston  Phoenix   New York
Boston      5       7         10
Phoenix     7       20         4
New York    8       1          6

我希望能找到最有价值的一对城市。在这种情况下，我想返回凤凰城。

我试过：

cityMax = df.values.max()
cityPairs = df.idxmax()

第一个只给我最大的值(20)，第二个给我每个城市最大的一对，而不仅仅是总体的最大值。是否有一种方法可以返回数据value中指定值的索引和列标题？

python

numpy

indexing

max

dataframe

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-04-08 03:13:46

使用un堆栈()并使用idxmax()将顶部的MultiIndex解压缩为元组

import pandas as pd
data = [[5, 7, 10], [7, 20, 4,], [8, 1, 6,]]
cities = ['Boston', 'Phoenix', 'New York']
df = pd.DataFrame(data, columns=cities, index=cities)

print df.unstack().idxmax()

('Phoenix', 'Phoenix')

票数 2

Stack Overflow用户

发布于 2015-04-08 03:14:27

你也可以试试这个

In [15]: df_mat = df.as_matrix()

In [16]: cols, idxs = np.where(df_mat == np.amax(df_mat))

In [17]: ([df.columns[col] for col in cols], [df.index[idx] for idx in idxs])
Out[17]: (['Phoenix'], ['Phoenix'])

@piemont方法似乎更优雅。但是，我想知道在您的情况下(数据的大小)，哪种方法会工作得更快。你能通过在你的全部数据上设定这些函数的时间来检查一下吗？

票数 1

Stack Overflow用户

发布于 2015-04-08 03:25:33

row_city, column_city = (df.max(axis=1).idxmax(), df.max(axis=0).idxmax())

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/29504938

复制

相似问题

问获取数据中最大值的(行、列)指标
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问获取数据中最大值的(行、列)指标EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问获取数据中最大值的(行、列)指标
EN