首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏杨建荣的学习笔记

    推荐几个统计数据网站

    这是学习笔记的第 2002 篇文章 今天梳理了下统计方向一些不错的数据网站,如果我们后续要做一些相关的数据分析,可以参考这些数据。 其实我们大多数人对于统计数据都不太重视,通常感觉都是在说别人的事情。 首先推荐的就属国家统计局的网站了,我们可以从数据查询的相关入口来进行。 ? 这里有一个可视化产品,还是很值得推荐的,比如我们选择对外贸易的统计数据,从以下数据可以看到,现在是以欧盟为重点目标。 ? 查看中国人民银行的网站,有如下的三个地方值得推荐。 http://www.pbc.gov.cn ? 这里面的报告相对比较专业,需要一定的背景知识。 财政部网站,通过这个网站可以网络一批统计数据。 北京大学的这个网站中会提供数据申请的通道,对于工作邮箱有一定的要求。 http://www.isss.pku.edu.cn/ ? 如果查看互联网相关的统计数据,互联网数据平台就是一个不错的选择。

    8.9K50发布于 2019-06-15
  • 来自专栏一个会写诗的程序员的博客

    select 统计数据

    select e.emp_name workID, sum(case when i.status = 'New' THEN 1 ELSE 0 END) bugNum, sum(case when i.status = 'New' and i.serious_level like '%blocker%' THEN 1 ELSE 0 END) blocker, sum(case when i.status = 'New' and i.serious_level like '%major%' THEN 1 ELSE 0 END) major, sum(case when i.status = 'New' and i.serious_level like '%normal%' THEN 1 ELSE 0 END) normal

    72830发布于 2018-08-17
  • 来自专栏实战docker

    spark实战之:分析维基百科网站统计数据(java版)

    在《寻找海量数据集用于大数据开发实战(维基百科网站统计数据)》一文中,我们获取到维基百科网站的网页点击统计数据,也介绍了数据的格式和内容,今天就用这些数据来练习基本的spark开发,开发语言是Java 以下是本次实战涉及的版本号: 操作系统:CentOS7 hadoop:2.8 spark:2.3 docker:17.03.2-ce docker-compose:1.23.2 维基百科网站统计数据简介 先回顾一下维基百科网站统计数据的内容和格式,一行数据的内容如下所示: aa.b User_talk:Sevela.p 1 5786 这一行由空格字符分割成了四个字段: 内容 意义 aa.b 项目名称, 实战功能简介 本次实战开发的spark应用的功能,是对网站统计数据进行排名,找出访问量最高的前100地址,在控制台打印出来并保存到hdsf; 源码下载 接下来详细讲述应用的编码过程,如果您不想自己写代码 至此,对维基百科网站统计数据的处理实战就完成了,希望此实战能够给您的大数据分析提供一些参考;

    97830发布于 2019-05-29
  • 来自专栏BestSDK

    网站分析基础——8个关键网站指标

    统计网站会在用户访问你的网站的时候,为你的这个用户创建一个 Cookie 并保存下来,那么当用户下次访问你的网站的时候,统计网站就会知道,哦,还是上次的那个用户又来访问你的网站了。 ? 首页的平均页面停留时间 网站停留时间 说好了网页停留时间之后再说网站停留时间就很简单了,还是以小光为例,我们不管小光中间在我们的网站做了什么,他9点的时候来到我们网站,然后9点10分的时候离开我们的网站 退出率的显示样式 转化率 转化率几乎是网站指标里最重要的一个了,因为几乎所有的网站不是为了盈利就是为了获得用户(当然获得用户也是为了最后盈利),所以电商网站需要了解有多少用户最后会在网站里购买东西 设定转化率的目标 参与度 参与度是8个关键网站指标的最后一个了,不得不说,参与度可能是一个有点玄学味道的指标,因为它不是由一个单一的数值来决定的。 总结 这8个关键网站指标只是网站分析的基础知识而已,通过网站分析来让网站越来越好还是需要更多的网站分析的知识储备,之后我会继续写网站分析相关的内容,敬请期待。 作者:offspring

    2.3K60发布于 2018-02-26
  • 来自专栏Python爬虫

    爬某ZF网站统计数据

    一、分析爬取目标 目标网站:济南市统计局官网的统计数据:http://jntj.jinan.gov.cn/col/col18253/index.html 出于职业操守(hai pa)的考虑,先看一下目标网站的 没错,反爬较弱的网站,可以这样。 但,济南市统计局网站,我试过直接用read_html(url),会返回403错误码,403 Forbidden!你懂了吧。。

    39210编辑于 2025-07-14
  • 来自专栏实战docker

    寻找海量数据集用于大数据开发实战(维基百科网站统计数据)

    的过程中,除了经典的WrodCount例子(用于统计文本文件中的单词出现次数),我们也在寻找其他海量数据来做更多实战以提高自己,今天介绍的是一个海量数据集的下载方法,以及数据内容的简介; 关于维基百科网站统计数据 数据的下载页面地址:https://dumps.wikimedia.org/other/pagecounts-raw 今天要下载的数据集就是维基百科的统计数据,如下图,有多个文件下载的连接,每个文件代表一个小时内所有 这个网站有2007年到2016年之间的统计数据,如下图,下载地址是:https://dumps.wikimedia.org/other/pagecounts-raw ? 这样就把2016年8月1日的所有统计数据下载下来了,其他日期的数据也可以用此方法批量下载; 数据格式简介 经过漫长等待终于将数据下载下来了,打开看看里面内容,如下所示: aa.b User_talk:Sevela.p

    1.1K60发布于 2019-05-27
  • 来自专栏数据山谷

    快速合并统计数据

    快速合并统计数据 今天我们来学习一下如何利用Power Query合并统计数据。例如我们需要将图1的数据归总为图2针对每一户家庭成员信息的表格形式。

    1.3K20发布于 2021-01-08
  • 来自专栏一个正经的测试

    ChatGPT 统计数据 2024(最全!)

    今日主题:ChatGPT 统计数据 自从出了Veo2,谷歌真的完完全全吊打了Open AI,Open AI更是计划推出2000美元的套餐,所有人都在觉得Open AI不行了,是不是有财政压力之类的说法, 我表示看客,但是对于Open AI在某种意义上来说,是AIGC的吹哨人,开启了AI的元年,正是因为他的出现,才会有这种的大模型如雨后春笋般出现 接下来,就让我们盘点一下,Open AI的一些数据吧 关键统计数据 ChatGPT 网站在 2024 年 4 月的访问量估计为18 亿(比 2024 年 2 月的 16 亿增加了约 2 亿),活跃用户估计为1 亿。 GPT-4 有两种版本,一种是 8K 版本,其上下文长度约为 8,000 个标记,另一种是 32K 版本,可以处理大约 32,000 个标记。 简单来说,这是从网页、文本和元数据中抓取的 8 年数据。 训练 ChatGPT 需要多长时间?

    94010编辑于 2024-12-19
  • 来自专栏PHP专享栏

    8网站防盗链秘籍

    如果你刚刚开发完一个没有防盗链的带有文件下载功能的网站,挂上internet,然后上传几个时下非常热门的软件或电影并在网站内公布下载地址,让所有好友都来体验一下你的杰作。 网站资源被盗链简单来说就是别人不是从你的网站通过下载资源,被盗链的几种可能情况: 1、人气非常旺的网站、论坛、社区的网页里直接引用了(使用标记)你网站上的图片,或者直接在其他网页(使用flash或媒体播放插件 )里嵌入了你网站上的mp3。 另外就是如果别人把从你网站下载的文件放到其他网站,那么仍然存在下载工具主动找上门的情况(虽然实际上它下载不了内容)。 方法8:打包下载 这个方法跟方法7的道理是一样的,只不过这次不是往原始文件里修改,而是在原始的文件基础上再加个“外壳”,让资源的哈希值跟别人的不一样。

    1.7K10发布于 2019-10-22
  • 来自专栏轮子工厂

    推荐8个堪称神器的网站

    分享8个提升学习能力的神奇网站,谁用谁知道。 “搞定设计”这个网站就为大家免费提供了很多漂亮又丰富的平面设计素材和模板,能够非常好的满足大家的设计需求! 链接:islide.cc/ 4、 Coursade 现在的网络学习资源非常丰富,无论是国内还是国外,有大量的教师将知名高校的学习视频发布在网络上,但同时也让我们难以检索,这个网站就是一个专门的公开课检索网站 链接:search.chongbuluo.com/ 7、 叮当设计 这个网站也是一个PPT模板、PS素材等平面设计资源下载网站,而比较重要的一点是,所有资源都是免费的哦,而不是一部分免费,一部分收费。 链接:dingdangsheji.com/ 8、 纳米学习导航 这是一个学习的导航网站,它收集了100多个学习网站的链接,内容包括了英语、面试题、考研、托福、考公务员等各个领域,mark一个相当于收藏了

    1.1K20发布于 2021-10-25
  • 来自专栏IDE项目开发编程交流

    网站加载慢、卡? 8网站性能优化逆袭方法

    看到这个网站慢到让人抓狂,用户天天在群里骂:"这破网站怎么又卡死了!"那种心情,真的很难受。今天咱们就聊聊怎么让网站快起来,大概有8网站性能优化方法,就像给老房子装修一样,一步步来,别急。 衡量网站性能的指标比如首屏加载时间、白屏时间、可交互时间等等。 网站性能优化的关键要素1.项目体积优化(代码复用、去掉代码中的空格、精简变量名等优化)。2.网站传输优化(从服务器获取到网站文件,然后在浏览器中加载)。3.网站加载优化(预加载、懒加载方式)。 怎么做:把服务器带宽从2M升级到8M,就像把水管加粗了。效果:原来几分钟的加载时间,直接变成几十秒。简单粗暴,但是贵啊!一个月要多花好几百。 真实例子:我有个朋友做图片站,用了CDN后,北京用户访问速度从8秒变成1秒,用户直接给他发红包说谢谢。第三招:让浏览器记住 - 缓存优化更新不频繁的网站缓存时间可以设置长一些。

    1.9K10编辑于 2025-08-10
  • 来自专栏机器学习/数据可视化

    pandas使用技巧-分组统计数据

    因为数据是随机生成的,我们需要检查是否有出现这种情况:name、subject、time、grade4个字段相同,但是score出现了两次,防止数据不规范。写了一个循环来进行判断:

    2.8K30发布于 2021-03-07
  • 来自专栏逆锋起笔

    2020 给你 8 个接私活的网站

    师长今天给大家推荐几个江湖卖艺赚钱养家的好渠道(程序员:8个接私活的网站,只要你有码,那“我”就有钱!)一起来看看吧! 8、我要外包网:找项目、找团队、投资合作,只要技术过硬就不怕没项目 http://www.51waibao.net ?

    3.4K20发布于 2020-02-21
  • 来自专栏州的先生

    8个方法极速提高Django网站速度

    在这里,州的先生分享8个简单(不需要复杂的操作和设置)、免费(不需要花钱升级服务器配置或购买加速包)、快速(能够很快看到效果)的方法,帮助大家优化自己的Django应用。 这8个方法的结构如下图所示: ? 下面我们来详细介绍。 一、压缩图片 对于图片较多的站点而言,图片的大小和数量直接影响着站点的访问速度。如果网站页面上的图片是必须存在的,那么就需要考虑对其进行优化。 二、压缩CSS/JS文件 对于一个Web网站而言,CSS为网站提供精美可观的界面、JS为网站实现各种动态的交互,都是必不可少的。 xml text/javascript application/x-httpd-php image/jpeg image/gif image/png; gzip_vary off; 最后,推荐两个用于网站测速的网站 / 九、最后 以上就是本次所介绍的8点加速Django应用的简单方法。

    3.6K30发布于 2019-07-09
  • 来自专栏全栈程序员必看

    Dreamweaver8 网站制作软件使用教程

    Dreamweaver是我喜欢做网站的软件。之所以喜欢Dreamweaver 8 是因为这个版本有折叠功能。 下面说说它的使用方法。 1、创建站点文件。 如果你喜欢软件EditPlus,可以看看这篇文章:网站制作工具之EditPlus的使用 附上这个软件的下载地址:Dreamweaver 8 (访问密码:7509) ————恢复内容开始———— Dreamweaver 是我喜欢做网站的软件。 之所以喜欢Dreamweaver 8 是因为这个版本有折叠功能。 下面说说它的使用方法。 1、创建站点文件。 如果你喜欢软件EditPlus,可以看看这篇文章:网站制作工具之EditPlus的使用 附上这个软件的下载地址:Dreamweaver 8 (访问密码:7509) 发布者:全栈程序员栈长,转载请注明出处

    1.7K10编辑于 2022-09-07
  • 来自专栏网安信息

    关于SSL证书10大统计数据

    十年前,只有大公司和购物网站会使用SSL证书进行加密传输数据,而如今,所有网站都必须进行加密,无论网站类型和大小。随着越来越多的用户在网上分享敏感数据,因此,保护这些数据不被窃取变得至关重要。 为了更好地查看 HTTPS 的普及情况,我们可以通过SSL 证书的10 项统计数据来了解。 stats-about-SSL-certificates.jpg 1. 5. 59.4%的网站未遵循最佳安全实践 根据SSL Pulse统计,一个用于监控Alexa排名前15万的最受欢迎网站的SSL/TLS质量的控制面板显示,其中有59.4%的网站未遵循SSL部署最佳安全实践 自2018年发布以来,SSL实验室调查的网站中有42.9%已经迁移到最新版本。仅3.8%的网站仍然使用现已弃用的SSL协议。 8. 85%的网上购物者弃用不安全网站 2014 年 11 月,GlobalSign对德国、法国、英国、荷兰和斯堪的纳维亚半岛的 6,000 名受访者进行了调查,以此了解欧洲的互联网安全常识。

    1.2K00发布于 2021-10-22
  • 来自专栏linux教程

    网站速度跟什么有关_影响网站速度慢的8个方面

    不管是自己建网站,还是请人建网站,你总会提出为什么我网站速度这么慢的疑问。 确实,大多数人的网站都会慢,但是只要自己学会优化网站速度,就会发现网站并不是真正的慢,只不过是有些地方没有做到位而已。 本文就给大家分析一下网站速度跟什么有关。 影响网站速度慢的8个方面 1、服务器 服务器是影响你网站速度慢最直接的原因,包括你服务器本身的性能,服务器所处位置,以即服务器提供商或者托管商的水平。 8网站代码 除了主题代码干净外,网站代码过多也会导致网站加载速度慢,例如添加多个统计代码、引用很多js文件等等。 网站速度慢会影响网站SEO吗? 即便没有列入,网站打开慢,会导致一部分人直接放弃访问你网站,用户访问量降低,让搜索引擎认为你网站内容不是用户想要的,从而也会导致排名降低。 怎么优化网站打开速度? 网站的打开速度对于网站运营者来说是一个需要关注的事情,如果能把网站优化到秒开,那么不管是自己还是访客,都会感觉很舒服。 我们从哪些方面可以来优化网站速度呢?

    2.6K20编辑于 2023-04-24
  • 来自专栏媒矿工厂

    自适应流播放统计数据

    在一个流媒体会话中,可能会经历带宽波动,导致自适应切换事件发生,流媒体的播放有下列特点:

    78030编辑于 2022-02-18
  • 来自专栏运维开发故事

    k8s实战之部署PHPJava网站

    我们需要在实际项目中进行应用,本文简单的介绍了当前比较主流的PHP/Java网站的部署 传统部署与K8S部署区别 通常使用传统的部署的时候,我们一个web项目,网站的搭建,往往使用的如下的一种整体架构, README.md service.yaml wordpress 使用wordpress创建一个博客网站,打开wordpress,编写Dockerfile构建镜像,然后推送到一个harbor镜像仓库中 livenessProbe: httpGet: path: /status.php port: 80 1.3 pod数据持久化 这里演示的是一个静态的web网站 创建一个harbor仓库的拉取镜像认证,,如果搭建php网站的时候创建过认证,这一步可以不用再创建,跳过 [root@k8s-master java-demo]# kubectl create secret java-demo]# kubectl adpply -f deployment.yaml 2.3 pod数据持久化 这里演示的是一个静态的web网站,基本不需要做持久化,直接把代码打包到了镜像中

    6.6K51发布于 2019-09-25
  • 来自专栏宣言(Siam)博客

    mysql聚合统计数据查询缓慢优化方案

    增加索引并不能解决聚合函数统计慢的问题 优化聚合统计的方案 提前预算 建立统计数据表,以日期区分,如:20190801一天,销售了多少订单、金额等等数据。 当订单产生(支付完成后 可统计数据)时,便在统计数据表中对应的日期增加金额、数量。 需要注意的是,如果有退款等场景会影响减少数据,记得也相应地做操作处理 当我们需要统计8月份的数据时候,则只需要遍历计算这一个月的三十来行数据。 来定时(比如每20分钟一次)计算总和,然后更新到统计数据表中。 优点:做的处理比较少,也无需改动退款操作等api,只需要依赖原订单表的数据,定时统计、刷新统计数据。 总结 索引并不能解决统计聚合数据慢的sql语句问题 聚合函数谨慎用 最好不用,因为我们无法预算以后的数据量需要扫描多少行数据来计算 优化方案离不开统计表,都需要按一定的周期储存运算好的统计数据

    7.5K30发布于 2019-12-18
领券