首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏杨建荣的学习笔记

    推荐几个统计数据网站

    这是学习笔记的第 2002 篇文章 今天梳理了下统计方向一些不错的数据网站,如果我们后续要做一些相关的数据分析,可以参考这些数据。 其实我们大多数人对于统计数据都不太重视,通常感觉都是在说别人的事情。 首先推荐的就属国家统计局的网站了,我们可以从数据查询的相关入口来进行。 ? 这里有一个可视化产品,还是很值得推荐的,比如我们选择对外贸易的统计数据,从以下数据可以看到,现在是以欧盟为重点目标。 ? 查看中国人民银行的网站,有如下的三个地方值得推荐。 http://www.pbc.gov.cn ? 这里面的报告相对比较专业,需要一定的背景知识。 财政部网站,通过这个网站可以网络一批统计数据。 北京大学的这个网站中会提供数据申请的通道,对于工作邮箱有一定的要求。 http://www.isss.pku.edu.cn/ ? 如果查看互联网相关的统计数据,互联网数据平台就是一个不错的选择。

    8.9K50发布于 2019-06-15
  • 来自专栏一个会写诗的程序员的博客

    select 统计数据

    select e.emp_name workID, sum(case when i.status = 'New' THEN 1 ELSE 0 END) bugNum, sum(case when i.status = 'New' and i.serious_level like '%blocker%' THEN 1 ELSE 0 END) blocker, sum(case when i.status = 'New' and i.serious_level like '%major%' THEN 1 ELSE 0 END) major, sum(case when i.status = 'New' and i.serious_level like '%normal%' THEN 1 ELSE 0 END) normal

    72830发布于 2018-08-17
  • 来自专栏实战docker

    spark实战之:分析维基百科网站统计数据(java版)

    在《寻找海量数据集用于大数据开发实战(维基百科网站统计数据)》一文中,我们获取到维基百科网站的网页点击统计数据,也介绍了数据的格式和内容,今天就用这些数据来练习基本的spark开发,开发语言是Java 以下是本次实战涉及的版本号: 操作系统:CentOS7 hadoop:2.8 spark:2.3 docker:17.03.2-ce docker-compose:1.23.2 维基百科网站统计数据简介 先回顾一下维基百科网站统计数据的内容和格式,一行数据的内容如下所示: aa.b User_talk:Sevela.p 1 5786 这一行由空格字符分割成了四个字段: 内容 意义 aa.b 项目名称, 实战功能简介 本次实战开发的spark应用的功能,是对网站统计数据进行排名,找出访问量最高的前100地址,在控制台打印出来并保存到hdsf; 源码下载 接下来详细讲述应用的编码过程,如果您不想自己写代码 至此,对维基百科网站统计数据的处理实战就完成了,希望此实战能够给您的大数据分析提供一些参考;

    97830发布于 2019-05-29
  • 来自专栏又见苍岚

    Hexo -11- 修改网站Logo

    Next 主题默认的网站logo是字母N,本文介绍如何更换成自己的logo。

    1.6K30编辑于 2022-08-04
  • 来自专栏Python爬虫

    爬某ZF网站统计数据

    一、分析爬取目标 目标网站:济南市统计局官网的统计数据:http://jntj.jinan.gov.cn/col/col18253/index.html 出于职业操守(hai pa)的考虑,先看一下目标网站的 没错,反爬较弱的网站,可以这样。 但,济南市统计局网站,我试过直接用read_html(url),会返回403错误码,403 Forbidden!你懂了吧。。

    39210编辑于 2025-07-14
  • 来自专栏实战docker

    寻找海量数据集用于大数据开发实战(维基百科网站统计数据)

    的过程中,除了经典的WrodCount例子(用于统计文本文件中的单词出现次数),我们也在寻找其他海量数据来做更多实战以提高自己,今天介绍的是一个海量数据集的下载方法,以及数据内容的简介; 关于维基百科网站统计数据 数据的下载页面地址:https://dumps.wikimedia.org/other/pagecounts-raw 今天要下载的数据集就是维基百科的统计数据,如下图,有多个文件下载的连接,每个文件代表一个小时内所有 这个网站有2007年到2016年之间的统计数据,如下图,下载地址是:https://dumps.wikimedia.org/other/pagecounts-raw ? 这样就把2016年8月1日的所有统计数据下载下来了,其他日期的数据也可以用此方法批量下载; 数据格式简介 经过漫长等待终于将数据下载下来了,打开看看里面内容,如下所示: aa.b User_talk:Sevela.p

    1.1K60发布于 2019-05-27
  • 来自专栏数据山谷

    快速合并统计数据

    快速合并统计数据 今天我们来学习一下如何利用Power Query合并统计数据。例如我们需要将图1的数据归总为图2针对每一户家庭成员信息的表格形式。

    1.3K20发布于 2021-01-08
  • 来自专栏一个正经的测试

    ChatGPT 统计数据 2024(最全!)

    今日主题:ChatGPT 统计数据 自从出了Veo2,谷歌真的完完全全吊打了Open AI,Open AI更是计划推出2000美元的套餐,所有人都在觉得Open AI不行了,是不是有财政压力之类的说法, 我表示看客,但是对于Open AI在某种意义上来说,是AIGC的吹哨人,开启了AI的元年,正是因为他的出现,才会有这种的大模型如雨后春笋般出现 接下来,就让我们盘点一下,Open AI的一些数据吧 关键统计数据 ChatGPT 网站在 2024 年 4 月的访问量估计为18 亿(比 2024 年 2 月的 16 亿增加了约 2 亿),活跃用户估计为1 亿。 ChatGPT 网站在 2023 年 12 月的访问量估计为16 亿(比 2023 年 11 月减少了约 10 亿),预计有1亿的用户 该工具创下了消费应用程序历史上用户群增长最快的记录,仅用5天就获得了 OpenAI 网站访问者大多数(60.97%)年龄在 18 至 34 岁之间,其中男性占54.11%,女性占 45.89%。 GPT-3 推出后,导致AI 代币加密货币价格上涨高达76.7%。

    94010编辑于 2024-12-19
  • 来自专栏zjblog

    从零开始做网站11-博客开发

    a href="/">LT's Blog

          
    44030编辑于 2022-06-21
  • 来自专栏机器学习/数据可视化

    pandas使用技巧-分组统计数据

    因为数据是随机生成的,我们需要检查是否有出现这种情况:name、subject、time、grade4个字段相同,但是score出现了两次,防止数据不规范。写了一个循环来进行判断:

    2.8K30发布于 2021-03-07
  • 来自专栏个人编程技术学习与分享

    Python Django个人网站搭建11-优化文章模块

    作者: zifanwang  发布于2020-05-17

    61830编辑于 2021-12-14
  • 来自专栏清菡软件测试

    Jmeter系列之《11.性能测试实战--Web网站

    目录 一、实操 1.项目背景 2.需求 3.场景 4.监控 5.步骤 二、报错的原因 三、总结 一、实操 1.项目背景 某网站。 环境:windows 2.需求 并发登录的性能。

    97610编辑于 2022-06-21
  • 来自专栏网安信息

    关于SSL证书10大统计数据

    十年前,只有大公司和购物网站会使用SSL证书进行加密传输数据,而如今,所有网站都必须进行加密,无论网站类型和大小。随着越来越多的用户在网上分享敏感数据,因此,保护这些数据不被窃取变得至关重要。 为了更好地查看 HTTPS 的普及情况,我们可以通过SSL 证书的10 项统计数据来了解。 stats-about-SSL-certificates.jpg 1. 5. 59.4%的网站未遵循最佳安全实践 根据SSL Pulse统计,一个用于监控Alexa排名前15万的最受欢迎网站的SSL/TLS质量的控制面板显示,其中有59.4%的网站未遵循SSL部署最佳安全实践 自2018年发布以来,SSL实验室调查的网站中有42.9%已经迁移到最新版本。仅3.8%的网站仍然使用现已弃用的SSL协议。 8. 85%的网上购物者弃用不安全网站 2014 年 11 月,GlobalSign对德国、法国、英国、荷兰和斯堪的纳维亚半岛的 6,000 名受访者进行了调查,以此了解欧洲的互联网安全常识。

    1.2K00发布于 2021-10-22
  • 来自专栏媒矿工厂

    自适应流播放统计数据

    在一个流媒体会话中,可能会经历带宽波动,导致自适应切换事件发生,流媒体的播放有下列特点:

    78030编辑于 2022-02-18
  • 来自专栏大数据文摘

    11:十大电商网站性能哪家强?

    11全天,Raincent利用小蜜蜂测量平台对中国目前10大最主要的电子商务平台的网站进行监测,总结出十大电子商务网站性能数据报告。 一、网站速度 双11当天的用户数比平时增加几百倍,订单量成百或成万倍的增长,网站速度直接影响的是电商网站用户的体验感受,同时也影响订单转化率。 同时国美的双11活动从11月10日0点就已经开始,长达3天,延续到11月12日24点,所以瞬间拥挤的状况不明显。 2、其次是亚马逊的网站速度1263ms,同样没有达到行业标准,这可能与亚马逊的服务器不在中国有关,当然好在亚马逊中国的双11活动从11月4号就已经开始了,所以同样瞬间访问的压力并不大。 4、淘宝网站速度最快,在300ms以下,淘宝网此次并没有大量的参与到双11中来。

    8.1K70发布于 2018-05-23
  • 来自专栏茹莱神兽博客

    影响企业网站收录与排名的11个因素

    那么,影响网站收录与排名的因素有哪些呢? 以下是良家佐言整理的关于影响网站收录的11个因素 1、网站改动频繁 医美行业的发展,让我们发现有很多明星出来后和之前的形象不一样了。 如果蜘蛛抓取的时候来了你网站两回,结果网站却打不开,那么蜘蛛就会认为这是个废弃的网站,退走后就不会再来了。 9、网站外链问题 网站外链优化是SEO的重要工作,有规律有质量的更新网站的外链,不但能提高网站的收录,还能影响网站关键词的排名。 网站外链优化主要体现在网站的相关性、多样性、数量化以及质量化。 11、搜索引擎算法更新升级 每一次搜索引算法更新升级时,都会影响一大批网站,甚至有些网站会被搜索引擎直接屏蔽,算法更新或多或少会影响网站的收录问题。 对症下药才能药到病除,对于网站收录问题也一样,只有找好了网站没有被收录的原因所在,并想办法改善,网站收录才可能变好。

    94020编辑于 2024-10-07
  • 来自专栏java一日一条

    11个最值得Java开发者收藏的网站

    因此,我列举了11个能够帮助Java开发者提升编程能力的网站。名单中的这些热门网站能够涵盖学习资源,Q&A论坛,代码片段等丰富内容。 1.Stack Overflow ---- ? Stack Overflow是Java领域最具代表性的Q&A(问答)网站之一。该网站允许Web开发者,程序员,学习者发布相关问题或者为他们的编程问题找到答案。 DZone对专业软件开发者来说是最大的资源网站之一。该网站发布各技术领域的高技术含量内容,例如大数据,云计算,Java,物联网,web开发等。 此外,该网站还提供从基本到进阶的Java代码面试题及回答方式。 11.Concrete Page ---- ? Concrete Page无疑是学习Java最大的的资源类网站之一。 总结: 除了这些重要的网站外,对每一个Java开发者来说,最重要的是保持对Java编程语言的热爱。希望各位Java开发者能够收藏这些网站,不断学习,继续前进!

    1.5K10发布于 2018-09-14
  • 来自专栏Java帮帮-微信公众号-技术文章全总结

    11个最值得Java开发者收藏的网站

    因此,我列举了11个能够帮助Java开发者提升编程能力的网站。名单中的这些热门网站能够涵盖学习资源,Q&A论坛,代码片段等丰富内容。 1. DZone DZone对专业软件开发者来说是最大的资源网站之一。该网站发布各技术领域的高技术含量内容,例如大数据,云计算,Java,物联网,web开发等。 除此之外,该网站还提供与数据库、算法有关的编程问题的解决方法。 7. JavaSED JavaSED是一个大型的资源类网站,主要涉及Java源代码和Java代码示例。 该网站涵盖了最流行的Java编程概念,包括Java基本概念,面向对象的概念,阵列,异常处理,java字符串,封装类等。此外,该网站还提供从基本到进阶的Java代码面试题及回答方式。 11. 总结: 除了这些重要的网站外,对每一个Java开发者来说,最重要的是保持对Java编程语言的热爱。希望各位Java开发者能够收藏这些网站,不断学习,继续前进!

    2K40发布于 2018-03-15
  • 来自专栏宣言(Siam)博客

    mysql聚合统计数据查询缓慢优化方案

    增加索引并不能解决聚合函数统计慢的问题 优化聚合统计的方案 提前预算 建立统计数据表,以日期区分,如:20190801一天,销售了多少订单、金额等等数据。 当订单产生(支付完成后 可统计数据)时,便在统计数据表中对应的日期增加金额、数量。 来定时(比如每20分钟一次)计算总和,然后更新到统计数据表中。 优点:做的处理比较少,也无需改动退款操作等api,只需要依赖原订单表的数据,定时统计、刷新统计数据。 总结 索引并不能解决统计聚合数据慢的sql语句问题 聚合函数谨慎用 最好不用,因为我们无法预算以后的数据量需要扫描多少行数据来计算 优化方案离不开统计表,都需要按一定的周期储存运算好的统计数据

    7.5K30发布于 2019-12-18
  • 来自专栏Mr_du

    点播--获取播放统计数据文件下载地址

    https://cloud.tencent.com/document/product/266/12624

    78820发布于 2019-07-30
  • 领券