首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏测试开发干货

    数据工厂平台-8:首页统计功能

    想简单请直接跳转到第13章内容】 注意我们当前做的平台是数据构造平台,既然是数据,那么首页我们要弄成什么样呢? 最好就是 各种统计图 那种吧,看着还高大上~ 但是我们不能为了统计统计,好看不如实用,所以我们还是要先思考下,我们首页的第一个统计图: 【各个工具的使用次数统计】 也就是说,我们的平台不止会有一个工具 当然,每个工具被使用的时候,我们都要在统计表中记录好它被使用的次数,这样才能更加刺激其他同学在平台上创造数据构造小工具。 目前的设计主要会有四大模块: 大型数据工具 模块,此模块负责构造过程非常复杂且繁多,需要调用各种支撑服务的超大数据构造。 小工具类模块,此模块负责较小的脚本、数据构造、小工具等的模块。 下节课我们用vue和该统计图连接起来,控制它的展示数据等等。

    75130编辑于 2022-05-19
  • 来自专栏第三方工具

    Java8统计金额demo

    Java8统计金额demo package com.example.core.mydemo.java8; public class GoodsPriceDTO { private String setAmount(Integer amount) { this.amount = amount; } } package com.example.core.mydemo.java8;

    31710编辑于 2024-10-09
  • 来自专栏python3

    数据统计

    目录 Outline Vector norm Eukl. Norm L1 Norm reduce_min/max/mean argmax/argmin tf.equal Accuracy tf.unique Outline tf.norm tf.reduce_min/max/mean tf.argmax/argmin tf.equal tf.unique Vector norm Eukl. Norm \[ ||x||_2=|\sum_{k}x_k^2|^{\frac{1}{2}} \] Max.nor

    1.3K10发布于 2020-01-16
  • 来自专栏AustinDatabases

    MYSQL 8 统计信息持久化 与 null

    在任何数据库中统计信息是帮助数据库查询中走更适合的查询路径的基础,MYSQL 8 中持久化的统计信息怎么做,怎么能持久化后提高执行计划的稳定性。 and mysql.innodb_index_stats 这两个表中的 具体每个表变化多少数据量才开始进行统计,要看 innodb_stats_auto_recalc 这个参数,默认打开,并且一个表中的 实际上下面的某些东西可能和有些开源数据库有类似的地方了,可以调整的参数是在表的层面还是数据库层面,都可以细微的调整了,因为我们不能让每个表的数据的增量都一致,假象一个表一天的增量是100万行,一个是50 按照我们的MYSQL 的主键设置的方式,主键和索引列的值一般是不一样的,所以这里可以认为 n_diff_pfx02 大致就是你目前的表的行数(非准确,因为出发重新统计需要数据变化10%rows) 最后需要看一下 = null , no , null 在数据库里面到底是一个什么角色,并且要不要被统计统计信息里面来,都是应该考虑的问题,而MYSQL 将这个问题让用户来选择,实际上着也说明MYSQL 本身也对这个问题没有自己的解决方案

    97020发布于 2020-06-01
  • 来自专栏企鹅号快讯

    《教育统计与SPSS应用》学习笔记(8

    8讲 回归分析 主要内容 回归分析简介 一元线性回归分析 多元线性回归分析 第一部分 回归分析简介 一、回归分析的意义 表示变量之间的不确定性关系以及关系的密切程度,统计学上可以用相关关系来表达 二、回归分析主要解决以下几方面的问题: 1、通过分析大量的样本数据,确定变量之间的数学关系式 2、对所确定的数学关系式的可信程度进行各种统计检验,并区分出某一特定变量影响较为显著的变量和影响不显著的变量

    1.3K80发布于 2018-02-27
  • 来自专栏Hadoop数据仓库

    MADlib——基于SQL的数据挖掘解决方案(8)——数据探索之描述性统计

    ,其主要目的是了解数据统计学上反映的量的特征,以便我们更好地认识这些将要被挖掘的数据。 从统计学的角度,简单说统计的任务是由样本推断总体;从数据探索的角度,我们就要关注更具体的内容,通常是由样本推断总体的数据特征。 MADlib提供了描述性统计、概率统计、推论统计三类数据统计模块,本篇介绍描述性统计的相关函数及用法。 duration:FLOAT8类型,计算汇总值所用的秒数。 (2) 参数 参数名称 数据类型 描述 source_table TEXT 包含输入数据的源表名。 查看汇总统计数据

    2K20发布于 2019-05-25
  • 来自专栏全栈程序员必看

    数据分析统计

    by OI.AMNT desc group by to_char(OI.CRETE_DATE,'yyyy-mm-dd hh24') order by c desc 按小时统计数据

    68320发布于 2021-05-19
  • 来自专栏数据处理

    考勤数据统计

    读取考勤数据 import pandas as pd myKq = pd.read_excel("kq.xlsx") myKq[u'打卡日期'].values array([u'2017-12-29 17

    2.4K30发布于 2018-06-01
  • 来自专栏Linux基础入门

    Pandas | 数据统计

    前言 本次我们介绍Pandas数据统计函数,如针对数值类型的统计(获取样本个数、平均值、标准差、极值等);针对非数值类型的统计(获取每个类型的个数)以及计算相关系数和协方差。 本文框架 0. 读取数据数据预处理 2. 汇总类统计 3. 获取唯一值与按值计数 4. 相关系数与协方差 0. 导入Pandas import pandas as pd 1. 读取数据数据预处理 # 读取数据 data = pd.read_csv(". 2018-01-03 2℃ -5℃ 多云 北风 1-2级 28 优 1 3 2018-01-04 0℃ -8℃ # 数据统计 data.describe() # 返回结果 bWendu yWendu aqi aqiLevel count 365.000000

    1K10编辑于 2022-12-20
  • 来自专栏跟着飞哥学编程(全栈联盟社区)

    java8 集合 多字段 分组 统计个数

    list.add(u7);list.add(u3);list.add(u4);list.add(u5);list.add(u6); //原有list(根据第二个字段:userName和第四个字段:age 统计重复的记录数 ) //jdk8的方法统计个数: Map<String, Map<Integer, Long>> map = list.stream().collect(Collectors.groupingBy( User::getUserName,Collectors.groupingBy(User::getAge,Collectors.counting()))); //jdk8以下:         Map                 }             });             list2.add(user);         });         //遍历最后想要的结果(User中c为统计后的个数

    1.4K20编辑于 2022-11-30
  • 来自专栏PPV课数据科学社区

    【PPT】国家统计局:大数据统计

    【热门下载】 2015中国数据分析师行业峰会精彩PPT下载(共计21个文件) 关注PPV课微信菜单栏回复“2015数据分析师”即可下载 转自:数据

    1.8K40发布于 2018-04-24
  • 来自专栏菲宇

    Django 数据统计查询

    原文链接:https://www.cnblogs.com/jingqi/p/7425423.html Django 数据库抽象 API 描述了如何创建、检索、 但是在输了的数据中只会包含作者名和 average_rating 的统计。 你可以注意到 average_rating 在例子中显示地定义了。 缺省排序或 order_by() 子句的副作用 一个查询集中 order_by() 子句中的字段(或一个模型中缺省排序字段)会对输了数据产生影响,即使在 values() 中没有这些字段的定义时也同样会影响 但是在输了的数据中只会包含作者名和 average_rating 的统计。 你可以注意到 average_rating 在例子中显示地定义了。 缺省排序或 order_by() 子句的副作用 一个查询集中 order_by() 子句中的字段(或一个模型中缺省排序字段)会对输了数据产生影响,即使在 values() 中没有这些字段的定义时也同样会影响

    3K20发布于 2019-08-14
  • 来自专栏大数据&分布式

    Spark CBO统计数据

    统计信息 Spark 2.2 开始支持CBO优化,触发统计数据更新的时机如下: ANALYZE:AnalyzeTableCommand、AnalyzeColumnCommand; ALTER:AlterTableAddPartitionCommand Spark的元数据统计信息的获取有三种方式: 基于持久化的元数据metastore获取,目前仅支持Hive metastore; 基于InMemoryFileIndex,调用底层存储API(Hadoop Spark表统计有如下配置主键: spark.sql.statistics.totalSize:表数据文件总大小,单位byte; spark.sql.statistics.numRows:表数据总行数; ("table").count(); 字段统计信息:调用CommandUtils#computeColumnStats 封装执行,CommandUtils#computePercentiles 支持直方图统计各分段数据 (默认254分段),字段统计执行Spark Aggregate算子实现; 统计数据获取:获取表、分区信息会自动补充上统计数据信息; 统计数据更新:SessionCatalog#alterTableStats

    71396编辑于 2025-03-20
  • 来自专栏程序猿的大杂烩

    使用Hadoop统计日志数据

    用户行为日志概述 用户行为日志: 用户每次访问网站时所有的行为数据 访问、浏览、搜索、点击... 离线数据处理流程: 数据采集 例如可以使用Flume进行数据的采集:将web日志写入到HDFS 数据清洗 可以使用Spark、Hive、MapReduce等框架进行数据的清洗,清洗完之后的数据可以存放在 HDFS或者Hive、Spark SQL里 数据处理 按照我们的需求进行相应业务的统计和分析 数据处理结果入库 结果可以存放到RDBMS、NoSQL数据数据的可视化展示 通过图形化展示的方式展现出来 &token=f51e97d1cb1a9caac669ea8acc162b96 "mukewang/5.0.0 (Android 5.1.1; Xiaomi Redmi 3 Build/LMY47V), snapshots> </repository> </repositories> <properties> <project.build.sourceEncoding>UTF-8<

    1.5K20发布于 2020-09-23
  • 来自专栏Vamei实验室

    统计02:怎样描绘数据

    统计最开始的主要任务就是描述数据。正如我们在统计概述中提到的,群体的数据可能包含大量的数字,往往让人读起来头昏脑涨。电影《美丽心灵》中,数学家纳什不自觉地沉浸在一串数字中。 从物理的角度上来看,平均值和标准差所带的单位,都和原始数据相同。在多数统计案例中,大部分的群体数据会落在平均值加减一个标准差的范围内。 还有一些参数要通过对群体成员进行排序才能获得。 由于人们已经形成了约定俗成的数据绘图习惯,绘图方式上的过度创新甚至会误导读者。所以,这里出现的,也是经典的统计绘图形式。 由于这一系列统计教程主要用Python,我将基于Matplotlib介绍几种经典的数据绘图方式。Matplotlib是基于numpy的一套Python工具包,提供了丰富的数据绘图工具。 总结 在这一篇文章里,我主要用参数和绘图呈现群体的数据。类似的方法还经常用于呈现样品数据。由于在描绘样品时需要涉及到统计推断,所以我把样品描绘的方法放在将在统计推断的相关文章中讲解。

    1.9K70发布于 2018-01-18
  • 来自专栏大数据&分布式

    Presto CBO统计数据

    Presto基于ConnectorMetadata#getTableStatistics获取元数据信息,目前仅Hive Connector、Iceberg Connector支持获取元数据统计信息,统计信息用于树节点 、getPartitionStatistics; Iceberg统计数据:基于TableScan#planFiles 列出元数据文件,对元数据文件遍历操作,获取统计信息。 支持获取元数据统计信息,统计信息用于树节点Visitor遍历的CBO优化: Hive统计数据:调用HiveStatisticsProvider#getTableStatistics方法,底层调用对应 列出元数据文件,对元数据文件遍历操作,获取统计信息; 统计数据更新:MetadataManager#finishStatisticsCollection 控制元数据统计更新操作,仅Hive Connector 实现元数据统计执行,调用HiveMetadata#finishStatisticsCollection实现。

    54342编辑于 2024-05-12
  • 来自专栏奔跑的键盘侠

    Python——大数据词频统计

    今天来讲一个词频统计的方法,说高大上一点,就是大数据分析;看完以后,也不过数行代码而已。 用途倒是很广泛,比如我们统计某篇文章中的用词频率,网络热点词汇,再比如起名排行榜呀、热门旅游景点排行榜呀什么的,其实也都可以套用。 1 coding #! /usr/bin/env python3.7 # -*- coding: utf-8 -*- # @Time : 2020-03-29 22:04 # @Author : Ed Frey # @ 2 补充一个Counter函数用法 python内置模块collections中有个Counter函数,功能也极为强大,做实验设计可能会到,不过跟上面的单词统计不太一样。 /usr/bin/env python3.7 # -*- coding: utf-8 -*- # @Time : 2020-03-29 22:04 # @Author : Ed Frey # @

    1.8K10发布于 2020-03-31
  • 来自专栏生信小驿站

    pandas入门①数据统计

    使用如下缩写: df:任意的Pandas DataFrame对象 s:任意的Pandas Series对象 创建数据 # -*- coding: utf-8 -*- """ Created on pd import numpy as np import matplotlib.pyplot as plt 创建对象 # In[*] s = pd.Series([1,3,5,np.nan,6,8] df.columns 查看列名 df.values 查看矩阵 df.shape():查看行数和列数 df.info():查看索引、数据类型和内存信息 df.describe():查看数值型列的汇总统计 1':'3',['A','B']] Out[23]: A B 1 1.0 2013-01-02 2 1.0 2013-01-02 3 1.0 2013-01-02 数据统计 df.describe():查看数据值列的汇总统计 df.mean():返回所有列的均值 df.corr():返回列与列之间的相关系数 df.count():返回每一列中的非空值的个数 df.max(

    1.9K20发布于 2018-08-27
  • 来自专栏Vamei实验室

    统计02:怎样描绘数据

    统计最开始的主要任务就是描述数据。正如我们在统计概述中提到的,群体的数据可能包含大量的数字,往往让人读起来头昏脑涨。电影《美丽心灵》中,数学家纳什不自觉地沉浸在一串数字中。 从物理的角度上来看,平均值和标准差所带的单位,都和原始数据相同。在多数统计案例中,大部分的群体数据会落在平均值加减一个标准差的范围内。 还有一些参数要通过对群体成员进行排序才能获得。 由于人们已经形成了约定俗成的数据绘图习惯,绘图方式上的过度创新甚至会误导读者。所以,这里出现的,也是经典的统计绘图形式。 由于这一系列统计教程主要用Python,我将基于Matplotlib介绍几种经典的数据绘图方式。Matplotlib是基于numpy的一套Python工具包,提供了丰富的数据绘图工具。 总结 在这一篇文章里,我主要用参数和绘图呈现群体的数据。类似的方法还经常用于呈现样品数据。由于在描绘样品时需要涉及到统计推断,所以我把样品描绘的方法放在将在统计推断的相关文章中讲解。

    1.1K20发布于 2018-09-25
  • 来自专栏奇点大数据

    统计、概率和数据挖掘

    统计、概率、数据挖掘,这几个词经常伴随出现,尤其是统计和概率两个概念,几乎就像自然界的伴生矿一样分不了家,有很多出版社都出版过叫做《概率统计》的书籍。 我们这本书本身也不准备从学术的角度给统计和概率做严格的区分,在平时工作中我们用的统计大多为计数功能,例如使用SQL语言对数据库的某些字段进行计数(count)、求和(sum)、求平均(avg)等。 当然,概率的用法远其实不止这些,在数据挖掘中同样用到大量概率相关的算法,我们后面会有相当的篇幅进行说明。 数据挖掘这个词很多时候是和机器学习一起出现,现在网上众人对这个两个词的关系说法也是莫衷一是。 有的说数据挖掘包含机器学习,有的说机器学习是数据挖掘发展的更高阶段云云。数据挖掘和机器学习这样的词汇命名应该是信息科学自然进化和衍生出来的,带有一定的约定俗成的色彩,人们的看法见仁见智也在情理之中。 数据挖掘——首先是有一定量的数据作为研究对象,挖掘顾名思义,说明有一些东西并不是放在表面上一眼就能看明白,要进行深度的研究、对比、甄别等工作,最终从中找到规律或知识,“挖掘”这个词用的很形象。

    87540发布于 2018-04-11
领券