首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何计算大熊猫系列中的最小频率和最大频率

如何计算大熊猫系列中的最小频率和最大频率
EN

Stack Overflow用户
提问于 2021-10-20 10:46:13
回答 1查看 497关注 0票数 1

我正在研究一种确定数据集的最小和最大频率的方法。方法value_counts()返回数据的不同值和频率。我试过查看此处列出的文档,但它解决不了我的问题。我的目标是

  1. 确定不同值集合中的最大值。
  2. 确定与数据集中最大值相关联的频率。
  3. 确定不同值集合中的最小值。
  4. 确定与数据集中的最小值关联的频率。

例如,

样本输入数据

代码语言:javascript
复制
A1,A2,A3,Class
2,0.4631338,1.5,3
8,0.7460648,3.0,3
6,0.264391038,2.5,2
5,0.4406713,2.3,1
2,0.410438159,1.5,3
2,0.302901816,1.5,2
6,0.275869396,2.5,3
8,0.084782428,3.0,3
2,0.53226533,1.5,2
8,0.070034818,2.9,1
2,0.668631847,1.5,2
代码语言:javascript
复制
2    42
8    24
5    20
6    10
7     2
4     1
3     1

maxValue = 8,maxF = 24 minValue = 2,minF = 42

预期: maxf返回数据集的maxf频率,minf返回数据集的最小频率。

实数:我正忙于处理来自值计数的频率。

我编写了一个处理数据集的程序

代码语言:javascript
复制
def main():
    s = pd.read_csv('A1-dm.csv')
    print("******************************************************")
    print("Entropy Discretization                         STARTED")
    s = entropy_discretization(s)
    print("Entropy Discretization                         COMPLETED")

def entropy_discretization(s):

    I = {}
    i = 0
    n = s.nunique()['A1']
    print("******************")
    print("calculating maxf")
    maxf(s['A1'])
    print("******************")

def maxf(s):
    print(s.value_counts())


def minf(s):
    print(s.value_counts())

如果能对此提供任何帮助,我们将不胜感激。我

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-10-20 10:50:10

美国Series.idxmaxSeries.idxmin,必要时输出Series使用Series.agg

代码语言:javascript
复制
s = df['Class'].value_counts()
print (s)
3    5
2    4
1    2
Name: Class, dtype: int64

print (s.agg(['max','idxmax','min','idxmin']))
max       5
idxmax    3
min       2
idxmin    1
Name: Class, dtype: int64

另外:

代码语言:javascript
复制
print (s.max(), s.idxmax(), s.min(), s.idxmin())
5 3 2 1
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69644592

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档