首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏杨建荣的学习笔记

    推荐几个统计数据网站

    这是学习笔记的第 2002 篇文章 今天梳理了下统计方向一些不错的数据网站,如果我们后续要做一些相关的数据分析,可以参考这些数据。 其实我们大多数人对于统计数据都不太重视,通常感觉都是在说别人的事情。 首先推荐的就属国家统计局的网站了,我们可以从数据查询的相关入口来进行。 ? 这里有一个可视化产品,还是很值得推荐的,比如我们选择对外贸易的统计数据,从以下数据可以看到,现在是以欧盟为重点目标。 ? 查看中国人民银行的网站,有如下的三个地方值得推荐。 http://www.pbc.gov.cn ? 这里面的报告相对比较专业,需要一定的背景知识。 财政部网站,通过这个网站可以网络一批统计数据。 北京大学的这个网站中会提供数据申请的通道,对于工作邮箱有一定的要求。 http://www.isss.pku.edu.cn/ ? 如果查看互联网相关的统计数据,互联网数据平台就是一个不错的选择。

    8.9K50发布于 2019-06-15
  • 来自专栏一个会写诗的程序员的博客

    select 统计数据

    select e.emp_name workID, sum(case when i.status = 'New' THEN 1 ELSE 0 END) bugNum, sum(case when i.status = 'New' and i.serious_level like '%blocker%' THEN 1 ELSE 0 END) blocker, sum(case when i.status = 'New' and i.serious_level like '%major%' THEN 1 ELSE 0 END) major, sum(case when i.status = 'New' and i.serious_level like '%normal%' THEN 1 ELSE 0 END) normal

    72830发布于 2018-08-17
  • 来自专栏实战docker

    spark实战之:分析维基百科网站统计数据(java版)

    在《寻找海量数据集用于大数据开发实战(维基百科网站统计数据)》一文中,我们获取到维基百科网站的网页点击统计数据,也介绍了数据的格式和内容,今天就用这些数据来练习基本的spark开发,开发语言是Java 以下是本次实战涉及的版本号: 操作系统:CentOS7 hadoop:2.8 spark:2.3 docker:17.03.2-ce docker-compose:1.23.2 维基百科网站统计数据简介 先回顾一下维基百科网站统计数据的内容和格式,一行数据的内容如下所示: aa.b User_talk:Sevela.p 1 5786 这一行由空格字符分割成了四个字段: 内容 意义 aa.b 项目名称, 实战功能简介 本次实战开发的spark应用的功能,是对网站统计数据进行排名,找出访问量最高的前100地址,在控制台打印出来并保存到hdsf; 源码下载 接下来详细讲述应用的编码过程,如果您不想自己写代码 至此,对维基百科网站统计数据的处理实战就完成了,希望此实战能够给您的大数据分析提供一些参考;

    97830发布于 2019-05-29
  • 来自专栏Python爬虫

    爬某ZF网站统计数据

    一、分析爬取目标 目标网站:济南市统计局官网的统计数据:http://jntj.jinan.gov.cn/col/col18253/index.html 出于职业操守(hai pa)的考虑,先看一下目标网站的 html' # 目标网址 定义一个请求头,并发送请求: header = { # 请求头 'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 没错,反爬较弱的网站,可以这样。 但,济南市统计局网站,我试过直接用read_html(url),会返回403错误码,403 Forbidden!你懂了吧。。

    39210编辑于 2025-07-14
  • 来自专栏实战docker

    寻找海量数据集用于大数据开发实战(维基百科网站统计数据)

    的过程中,除了经典的WrodCount例子(用于统计文本文件中的单词出现次数),我们也在寻找其他海量数据来做更多实战以提高自己,今天介绍的是一个海量数据集的下载方法,以及数据内容的简介; 关于维基百科网站统计数据 数据的下载页面地址:https://dumps.wikimedia.org/other/pagecounts-raw 今天要下载的数据集就是维基百科的统计数据,如下图,有多个文件下载的连接,每个文件代表一个小时内所有 这个网站有2007年到2016年之间的统计数据,如下图,下载地址是:https://dumps.wikimedia.org/other/pagecounts-raw ? 这样就把2016年8月1日的所有统计数据下载下来了,其他日期的数据也可以用此方法批量下载; 数据格式简介 经过漫长等待终于将数据下载下来了,打开看看里面内容,如下所示: aa.b User_talk:Sevela.p

    1.1K60发布于 2019-05-27
  • 来自专栏数据山谷

    快速合并统计数据

    快速合并统计数据 今天我们来学习一下如何利用Power Query合并统计数据。例如我们需要将图1的数据归总为图2针对每一户家庭成员信息的表格形式。 5 小结 本篇文章主要使用了添加条件列和分组依据两个功能。通过本节,大家不难发现每一个操作其实都被Power Query记录成了对应的公式。这种公式被称为M语言公式。

    1.3K20发布于 2021-01-08
  • 来自专栏逸鹏说道

    MVC5 网站开发之九 网站设置

    网站配置一般用来保存网站的一些设置,写在配置文件中比写在数据库中要合适一下,因为配置文件本身带有缓存,随网站启动读入缓存中,速度更快,而保存在数据库中要单独为一条记录创建一个表,结构不够清晰,而且读写也没有配置文件容易实现 这次要做的是网站的基本信息,数据保存在SiteConfig.config。 一、网站配置类(SiteConfig) 1、在Nninesky.Core项目新建文件夹Config 2、在Config文件夹添加类SiteConfig。 红框部分为添加类型,说明了配置节的名称和类型,注意红线部分,restartOnExternalChanges设为"false",如果不设置,配置文件修改后会重启网站。 图中红框部分为添加内容,指明SiteConfig的位置文件在网站目录Config文件夹下名为SiteConfig.config的文件。

    1.5K50发布于 2018-04-10
  • 来自专栏一个正经的测试

    ChatGPT 统计数据 2024(最全!)

    今日主题:ChatGPT 统计数据 自从出了Veo2,谷歌真的完完全全吊打了Open AI,Open AI更是计划推出2000美元的套餐,所有人都在觉得Open AI不行了,是不是有财政压力之类的说法, ChatGPT 网站在 2024 年 4 月的访问量估计为18 亿(比 2024 年 2 月的 16 亿增加了约 2 亿),活跃用户估计为1 亿。 ChatGPT 网站在 2023 年 12 月的访问量估计为16 亿(比 2023 年 11 月减少了约 10 亿),预计有1亿的用户 该工具创下了消费应用程序历史上用户群增长最快的记录,仅用5天就获得了 GPT-5 OpenAI 正在继续开发 ChatGPT,据报道,GPT-5 将于 2023 年 12 月完成训练。 Sam Altman报告称,GPT-5 需要更多数据进行训练,计划使用互联网上公开可用的数据集。不过,目前尚未确定 GPT-5 的发布日期。

    94010编辑于 2024-12-19
  • 客流统计数据怎么用?5 个提升转化率的实战技巧

    真正有价值的是如何将客流统计数据转化为可执行的运营决策。数据显示,精准使用客流数据可以有效提升营销活动的投入产出比(ROI),并优化转化率。 一、理解客流统计数据的真正价值客流统计数据不仅是“有多少人来”,更关键的是洞察顾客行为和优化运营环节。 只有将客流统计数据纳入“收集–分析–行动–复盘”闭环,才能持续优化运营策略。闭环步骤 收集:通过计数器、监测设备持续采集数据。 分析:按时间、区域或渠道拆解数据,找出关键指标弱项。 结语将客流统计数据视为“运营决策的指南”,而非静态数字,是提升转化率的关键。通过分维度分析、热力图和动线优化、高峰排班、精准营销以及闭环运营,企业可以真正把数据转化为业务价值,实现流量到转化的提升。

    49410编辑于 2025-10-31
  • 来自专栏Python机器学习算法说书人

    基于 Django 的个人网站5

    <link rel="stylesheet" href="/static/css/bootstrap.min.css" integrity="sha384-Vkoo8x4CGsO3+Hhxv8T/Q<em>5</em>PaXtkKtu6ug<em>5</em>TOeNV6gBiFeWPGFN9MuhOf23Q9Ifjh 标签之前就可以起作用了,代码如下: <script src="/static/js/jquery.slim.min.js" integrity="sha384-J6qa4849blE2+poT4WnyKhv<em>5</em>vZF<em>5</em>SrPo0iEjwBvKU7imGFAV0wwj1yYfoRSJoZ DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>陈志豪的个人网站</title> <link > </head> <body>

    陈志豪的个人网站 > </head> <body>

    陈志豪的个人网站

    1.1K20发布于 2020-05-27
  • 来自专栏Java实战博客

    MD5解密 解密网站

    什么是MD5:可以产生出一个128位(16字节)的散列值(hash value) 也就是说MD5加密 会产生16位的字符串 百度说 这是不被认可为安全加密方式,可以被加以破解。 目前来说:市面上的MD5解密,一般都是采用碰撞的方式取解出来。 什么意思呢? 我有密码a ,经过加密后 xxxxxxxxxxxxxxxx 添加到密码库中。 你用网站查 输入一个MD5加密的值,去取值。 网站1 https://www.somd5.com/ 然后输入你们加密值,解不了开就换个网站网站2 https://www.cmd5.com/ 可能会收费,不过,有需要,还是不错的 特殊说明: 解决问题的光鲜,藏着磕Bug的痛苦。 万物皆入轮回,谁也躲不掉!

    5.1K10编辑于 2022-01-14
  • 来自专栏机器学习/数据可视化

    pandas使用技巧-分组统计数据

    subject_list = ["语文","数学","英文","生物","物理","地理",'化学'] # 科目 time_list = ['上','下'] # 上下学期 grade_list = [1,2,3,4,5,6

    2.8K30发布于 2021-03-07
  • 来自专栏京程一灯

    确保网站性能的5个小贴士

    翻译:疯狂的技术宅 作者:Jennifer Oksnevad 英文标题:5 Tips to ensure website performance 英文原文:https://www.catswhocode.com /blog/5-tips-to-ensure-website-performance 你设计并建立了一个很吸引眼球的网站。 但是如果您的网站不能正常运行,那么前面所提的那些就都不重要要。 ? 访问你网站的人不会呆呆地等着页面加载,你只有几秒钟的时间把他们正在寻找的东西显示出来,说不定他们会去你的竞争对手那里。 名人认可,正面的新闻报道或广泛的口碑可以使你的网站增加两、三倍流量甚至更多。如果您的网站在全世界都来敲门时崩溃,那么再好的宣传都将是无济于事的。 有两种方法可以检测你的网站是否能够处理增加的流量。 5)争取网络中立 如果FCC(美国联邦通信委员会)推翻他们的开放的互联网规则(目前他们正在考虑),你的网站可能会面临比对手慢的加载时间。如果发生这种情况,那么你在网站性上所做的所有努力都将付之东流。

    42630发布于 2019-03-28
  • 来自专栏小林coding

    上线 5 分钟,网站就炸了!

    昨晚我发文上线了自己的网站:小林的网站上线啦!,结果发文上线不到 10 分钟, 服务器就炸了,读者疯狂跟我说网站 500 错误了。 为什么网站访问很慢? 解决了 500 错误的问题后,后面又有很多读者反馈网站访问太慢了。 不瞒大家说,小林的服务器的配置确实很渣,还是去年阿里云活动白嫖的。 1核心 CPU,2 GB 内存,5M 带宽: 其实小林在开设网站之前,就调研了身边的朋友他们的服务器配置如何? 所以,网站访问慢的原因就是服务器的带宽不够。 我的网站属于静态网站,然后用 nginx 部署,没有用到数据库之类的东西,所以是一个很轻量级的网站,CPU 和 内存 目前为止都是完全够用的,而且文章的图片我都没有放到服务器上,而是放到另外一个图床,所以大家访问的只是服务器的前端文件

    62140编辑于 2022-04-07
  • 来自专栏网安信息

    关于SSL证书10大统计数据

    十年前,只有大公司和购物网站会使用SSL证书进行加密传输数据,而如今,所有网站都必须进行加密,无论网站类型和大小。随着越来越多的用户在网上分享敏感数据,因此,保护这些数据不被窃取变得至关重要。 为了更好地查看 HTTPS 的普及情况,我们可以通过SSL 证书的10 项统计数据来了解。 stats-about-SSL-certificates.jpg 1. 域名验证型(DV SSL证书)占94.3% 根据Netcraft的一份报告,域名验证型SSL证书以94.3%的份额占据主导地位,组织验证型证书(即OV SSL证书)占5%,而扩展验证型(即EV SSL证书 5. 59.4%的网站未遵循最佳安全实践 根据SSL Pulse统计,一个用于监控Alexa排名前15万的最受欢迎网站的SSL/TLS质量的控制面板显示,其中有59.4%的网站未遵循SSL部署最佳安全实践 10. 82.2%的网站使用有效的SSL证书 截止2021年,有82.2%的网站使用有效SSL证书,高于5年前的17.8%。这份由W3Techs提供的报告强调了HTTPS在过去几年里的应用进展。

    1.2K00发布于 2021-10-22
  • 来自专栏媒矿工厂

    自适应流播放统计数据

    5: 数据集收集信息明细 图6 给出了事件1的简要总结: 图6: 事件1数据 数据集的使用实例 流媒体客户端的行为建模 通过对数据的分析,我们发现播放器分辨率大小对流的选择有很大影响,带宽自适应不是唯一的问题

    78030编辑于 2022-02-18
  • 来自专栏全栈程序员必看

    h5电商模板_网站模板

    [HTML+CSS]电商网站模板 b站白嫖的网课,黑马的小兔鲜儿案例,教程链接点这里就行 成品 文件目录结构 CSS base.css:基本样式,内外边距,字体之类的 common.css:网页的公共样式 ,活动图片等 favicon.ico 网站图标 index.html 首页的html SEO 三大标签 搜索引擎优化,又称为 SEO ,即 Search Engine Optimization 两种优化方式 -- #网站入口模块-->

    <! div> </body> </html> CSS base.css /* 去除常见标签默认的 margin 和 padding */ body, h1, h2, h3, h4, h5, */ .xtx-entry{ height: 500px; background-color: #f5f5f5; } .xtx-entry .container{ position: relative

    10.3K10编辑于 2022-11-10
  • 来自专栏网站设计制作、数字营销

    想做HTML5公司网站网站是改版好还是重新做个新网站

    国际上现在比较流行的企业网站基本上都已经替换成HTML5新一代网站制作技术,这类的网站可以在电脑端、平板端、手机端自动适应页面排版展现,在各种浏览终端上均具有非常优质的用户体验,是最新的网站设计制作趋势 目前在国内,很多知名的企业尤其是外资及合资企业网站正已经或正在转变成为HTML5响应式网站。 那么作为目前还是普通网站的广大企业来说,如果想做个HTML5网站,是将原网站改版好呢,还是重新做个新网站好? 这种情况下往往要具体情况下综合考虑而定。 往往从原网站程序质量、SEO程度、改版难易度、预算等方面来综合考量。 1,原网站程序代码质量度 如果原网站程序经常会有问题,被黑的情形比较常见,那么最好还是重新做个HTML5网站。 3,网站改版难易度 由于做网站改版,网站制作建设公司还需熟悉原网站代码,由于原网站之前的程序代码水平不太一致,因此改版难易程度也不大一样,如果改版难度较大,不如新做个网站合适。

    1.8K00发布于 2018-10-19
  • 来自专栏全栈程序员必看

    h5 Python_python做h5网站

    其版本包括了HDF4和现在大量用的HDF5。h5是HDF5文件格式的后缀。h5文件对于存储大量数据而言拥有极大的优势,这里安利大家多使用h5文件来存储数据,既高逼格又高效率。 (三)使用python对h5文件进行操作 python对h5文件的操作依赖于h5py包 通过举个栗子来介绍h5py包是如何读写h5文件的 读h5文件: # Reading h5 file import h5py with h5py.File('cat_dog.h5',"r") as f: for key in f.keys(): #print(f[key], key, f[key].name, f[ Dataset): print(f[k].value) else: print(f[k].name) 写h5文件: # Writing h5 import h5py import numpy as np # mode可以是"w",为防止打开一个已存在的h5文件而清除其数据,故使用"a"模式 with h5py.File("animals.h5", 'a') as f: f.create_dataset

    1.9K10编辑于 2022-09-30
  • 来自专栏宣言(Siam)博客

    mysql聚合统计数据查询缓慢优化方案

    增加索引并不能解决聚合函数统计慢的问题 优化聚合统计的方案 提前预算 建立统计数据表,以日期区分,如:20190801一天,销售了多少订单、金额等等数据。 当订单产生(支付完成后 可统计数据)时,便在统计数据表中对应的日期增加金额、数量。 来定时(比如每20分钟一次)计算总和,然后更新到统计数据表中。 优点:做的处理比较少,也无需改动退款操作等api,只需要依赖原订单表的数据,定时统计、刷新统计数据。 总结 索引并不能解决统计聚合数据慢的sql语句问题 聚合函数谨慎用 最好不用,因为我们无法预算以后的数据量需要扫描多少行数据来计算 优化方案离不开统计表,都需要按一定的周期储存运算好的统计数据

    7.5K30发布于 2019-12-18
领券