搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏杨建荣的学习笔记
推荐几个统计数据的网站
这是学习笔记的第 2002 篇文章今天梳理了下统计方向一些不错的数据网站，如果我们后续要做一些相关的数据分析，可以参考这些数据。其实我们大多数人对于统计数据都不太重视，通常感觉都是在说别人的事情。首先推荐的就属国家统计局的网站了，我们可以从数据查询的相关入口来进行。 ? 这里有一个可视化产品，还是很值得推荐的，比如我们选择对外贸易的统计数据，从以下数据可以看到，现在是以欧盟为重点目标。 ? 查看中国人民银行的网站，有如下的三个地方值得推荐。 http://www.pbc.gov.cn ? 这里面的报告相对比较专业，需要一定的背景知识。财政部网站，通过这个网站可以网络一批统计数据。北京大学的这个网站中会提供数据申请的通道，对于工作邮箱有一定的要求。 http://www.isss.pku.edu.cn/ ? 如果查看互联网相关的统计数据，互联网数据平台就是一个不错的选择。
8.9K50发布于 2019-06-15
来自专栏一个会写诗的程序员的博客
select 统计数据
select e.emp_name workID, sum(case when i.status = 'New' THEN 1 ELSE 0 END) bugNum, sum(case when i.status = 'New' and i.serious_level like '%blocker%' THEN 1 ELSE 0 END) blocker, sum(case when i.status = 'New' and i.serious_level like '%major%' THEN 1 ELSE 0 END) major, sum(case when i.status = 'New' and i.serious_level like '%normal%' THEN 1 ELSE 0 END) normal
72830发布于 2018-08-17
来自专栏实战docker
spark实战之：分析维基百科网站统计数据(java版)
在《寻找海量数据集用于大数据开发实战(维基百科网站统计数据)》一文中，我们获取到维基百科网站的网页点击统计数据，也介绍了数据的格式和内容，今天就用这些数据来练习基本的spark开发，开发语言是Java 以下是本次实战涉及的版本号：操作系统：CentOS7 hadoop：2.8 spark：2.3 docker：17.03.2-ce docker-compose：1.23.2 维基百科网站统计数据简介先回顾一下维基百科网站统计数据的内容和格式，一行数据的内容如下所示： aa.b User_talk:Sevela.p 1 5786 这一行由空格字符分割成了四个字段：内容意义 aa.b 项目名称，实战功能简介本次实战开发的spark应用的功能，是对网站统计数据进行排名，找出访问量最高的前100地址，在控制台打印出来并保存到hdsf；源码下载接下来详细讲述应用的编码过程，如果您不想自己写代码至此，对维基百科网站统计数据的处理实战就完成了，希望此实战能够给您的大数据分析提供一些参考；
97830发布于 2019-05-29
来自专栏Python爬虫
爬某ZF网站统计数据
一、分析爬取目标目标网站：济南市统计局官网的统计数据：http://jntj.jinan.gov.cn/col/col18253/index.html 出于职业操守（hai pa）的考虑，先看一下目标网站的 import pandas as pd # 存入数据 import requests # 发送请求定义爬取目标网址： url = 'http://jntj.jinan.gov.cn/art/2022/2/ excel时，由于我想把每个表格放到1个sheet页里，所以，这样实现逻辑： with pd.ExcelWriter('data.xlsx') as writer: for i in range(2, table_count - 1): # 第0、1、-1个表格不是需要的，所有从第2个开始 df[i].to_excel(writer, sheet_name=str(i), index=False 没错，反爬较弱的网站，可以这样。但，济南市统计局网站，我试过直接用read_html(url)，会返回403错误码，403 Forbidden！你懂了吧。。
39210编辑于 2025-07-14
来自专栏实战docker
寻找海量数据集用于大数据开发实战(维基百科网站统计数据)
的过程中，除了经典的WrodCount例子（用于统计文本文件中的单词出现次数），我们也在寻找其他海量数据来做更多实战以提高自己，今天介绍的是一个海量数据集的下载方法，以及数据内容的简介；关于维基百科网站统计数据 数据的下载页面地址：https://dumps.wikimedia.org/other/pagecounts-raw 今天要下载的数据集就是维基百科的统计数据，如下图，有多个文件下载的连接，每个文件代表一个小时内所有这个网站有2007年到2016年之间的统计数据，如下图，下载地址是：https://dumps.wikimedia.org/other/pagecounts-raw ? 这一天其他23个小时的统计文件的地址，只要把"00000"改成"01000"、"02000"，找到了规律就可以用迅雷来做批量下载了；打开迅雷软件，如下图操作，点击红框1中的加号，在弹出的窗口点击红框2中的如下图，在弹出的窗口中，将前面的url粘贴进去，然后将红框1中的两个"0"改成"(*)"，再把红框2中的数字改为23，然后点击下面的"确定"按钮： ?
1.1K60发布于 2019-05-27
来自专栏数据山谷
快速合并统计数据
快速合并统计数据 今天我们来学习一下如何利用Power Query合并统计数据。例如我们需要将图1的数据归总为图2针对每一户家庭成员信息的表格形式。图1 图2 接下来就和小编来看一看具体是如何操作的吧！ 1 将表格导入到【查询编辑器】中，点击【将第一行作为标题】。然后点击功能区的【添加列】-【条件列】，将【新列名】命名为【户主】。 2 选择新增的【户主】列，点击功能区的【转换】-【填充】-【向下】。 3 选择【户主】字段，点击【主页】-【分组依据】。
1.3K20发布于 2021-01-08
来自专栏一个正经的测试
ChatGPT 统计数据 2024（最全！）
今日主题：ChatGPT 统计数据 自从出了Veo2,谷歌真的完完全全吊打了Open AI，Open AI更是计划推出2000美元的套餐，所有人都在觉得Open AI不行了，是不是有财政压力之类的说法，我表示看客，但是对于Open AI在某种意义上来说，是AIGC的吹哨人，开启了AI的元年，正是因为他的出现，才会有这种的大模型如雨后春笋般出现接下来，就让我们盘点一下，Open AI的一些数据吧关键统计数据 ChatGPT 网站在 2024 年 4 月的访问量估计为18 亿（比 2024 年 2 月的 16 亿增加了约 2 亿），活跃用户估计为1 亿。 ChatGPT 网站在 2023 年 12 月的访问量估计为16 亿（比 2023 年 11 月减少了约 10 亿），预计有1亿的用户该工具创下了消费应用程序历史上用户群增长最快的记录，仅用5天就获得了 OpenAI 网站访问者大多数（60.97%）年龄在 18 至 34 岁之间，其中男性占54.11%，女性占 45.89%。 GPT-3 推出后，导致AI 代币加密货币价格上涨高达76.7%。
94010编辑于 2024-12-19
来自专栏全栈程序员必看
O2O网站
中文名 O2O网站（离线商务网站）外文名 Online to Offline 网站模式网站预订、支付，预订、支付信息应用电子商务运营目录 1 国内网站 2 最受关注 3 网站模式 4 国外网站 ▪ Uber ▪ Hilburn ▪ Getaround ▪ Jetsetter ▪ Airbnb ▪ Zaarly 国内网站编辑美团、拉手、窝窝团这类传统团购网站，他们的模式既包含了O2O的成分，也包含O2O以外的东西，完全可以称为采用O2O模式运营的网站非常少 O2O（Online To Offline）已经成为电子商务网站的下一个掘金点。 O2O让传统的商业流变成可以数字化的信息流、现金流，将线上和线下的障碍彻底打通，激活了一个巨大的蓝海。网站模式编辑 O2O模式要求消费者网站预订、支付，预订、支付信息会成为商家了解消费者购物信息的渠道，方便商家对消费者购买数据的搜集，进而达成区域化精准营销的目的，更好地维护并拓展区域性客户。
1.2K20发布于 2021-10-18
来自专栏数商云贸
大型网站架构系列：电商网站架构案例(2)
电网网站架构案例系列的第二篇文章。主要讲解网站架构分析，网站架构优化，业务拆分，应用集群架构，多级缓存，分布式Session。拆分后的架构图：参考部署方案2 （1）如上图每个应用单独部署（2）核心系统和非核心系统组合部署 6.2应用集群部署（分布式，集群，负载均衡）分布式部署：将业务拆分后的应用单独部署，应用直接通过RPC （理论上是1:2即可）。根据业务特性可使用以下缓存过期策略：（1）缓存自动过期；（2）缓存触发过期； 6.4单点登录（分布式Session）系统分割为多个子系统，独立部署后，不可避免的会遇到会话管理的问题。流程说明（1）用户第一次登录时，将会话信息（用户Id和用户信息），比如以用户Id为Key，写入分布式Session；（2）用户再次登录时，获取分布式Session，是否有会话信息，如果没有则调到登录页
2.4K41发布于 2019-05-09
来自专栏机器学习/数据可视化
pandas使用技巧-分组统计数据
subject_list = ["语文","数学","英文","生物","物理","地理",'化学'] # 科目 time_list = ['上','下'] # 上下学期 grade_list = [1,2,3,4,5,6 模拟数据2 数据 import pandas as pd df = pd.DataFrame({ 'group': [1, 1, 2, 3, 3, 3, 4], 'param': [' 分组统计方法2 整体方法说明： ? 分步骤解释： 1、找出数据不是null的值 ? 2、统计para参数中的唯一值 ?
2.8K30发布于 2021-03-07
来自专栏Python机器学习算法说书人
基于 Django 的个人网站（2）
, 'view': 'h2', 'title': 'Heading 2', 'class': 'ck-heading_heading2'}, {'model': 'heading3 , 'view': 'h2', 'title': 'Heading 2', 'class': 'ck-heading_heading2'}, {'model': 'heading3 DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>陈志豪的个人网站</title> </head> --suppress HtmlDeprecatedAttribute -->
陈志豪的个人网站
{% for article in articles %} <h2>{{ article.title }}</h2>
{{ article.abstract }}
{% endfor %}
{% if is_paginated
3K20发布于 2020-05-27
来自专栏网安信息
关于SSL证书10大统计数据
十年前，只有大公司和购物网站会使用SSL证书进行加密传输数据，而如今，所有网站都必须进行加密，无论网站类型和大小。随着越来越多的用户在网上分享敏感数据，因此，保护这些数据不被窃取变得至关重要。为了更好地查看 HTTPS 的普及情况，我们可以通过SSL 证书的10 项统计数据来了解。 stats-about-SSL-certificates.jpg 1. 已有1.57亿张SSL证书应用于互联网根据BuiltWith的数据，截至2021年2月18日，检测到在互联网上已有超过157,605,195亿张SSL证书，这几乎是去年的两倍。 2. SSL证书市场份额的96%是由这9个CA机构颁发 43.6%的网站使用的 IdenTrust CA签发的证书，占SSL 证书市场份额为 52.7%。在 2021 年 2 月 4 日监控的 137,270 个站点中，有81,605 个站点存在安全性不足的问题。无论是不完整的证书链还是弱密码，这个惊人的数字都表明了为什么正确配置SSL证书至关重要。
1.2K00发布于 2021-10-22
来自专栏媒矿工厂
自适应流播放统计数据集
Bandwidth estimation：带宽预测，用于计算与预测可用的网络带宽 Adaptation engine：自适应引擎，根据可用网络带宽、比特率阶梯、缓冲区装载程度以及其他因素选择一个版本图2: 使用机器学习对流媒体客户端与系统更好地建模流媒体客户端的最佳设计自适应流媒体系统的性能分析内容感知的编码优化多屏幕分发优化附上演讲视频： http://mpvideo.qpic.cn/0b2efqaaiaaa3qags6p6sfqvalgdaqwaabaa.f10002 dis_k=d46c785c30818b626a10caf0a2c86384&dis_t=1645153183&vid=wxv_2256065279388762125&format_id=10002&support_redirect
78030编辑于 2022-02-18
来自专栏前端心念
koa2实现网站csrf防御
先说常见的登陆鉴权：用户在你的网站登陆后，一般把登陆凭证（token）存储在cookie里，之后每次调接口都会自动携带，后端根据这条cookie鉴权，判定是登陆状态，进而允许进行安全操作。，请求时，需要先进行csrf比对，取出request请求头里的csrfToken和自己session里的csrfToken进行比对，完全一致才放行代码实现前端（react） 1//App.tsx 2/ cookie.get("csrf_token")) { 5 request("/all/getCsrfToken"); 6 } 7 }, []); 1//request.ts 2//axios 后端利用koa-csrf中间件实现 1yarn add koa-csrf 1、先封装一个csrf实例 1//先封装一个csrf实例 2const CSRF = require("koa-csrf"); 2、写一个给前端种植csrfToken的接口（必须是get） 1const Csrf = require("@utils/csrf"); 2 3router.get("/getCsrfToken", Csrf
1.5K20编辑于 2023-01-11
来自专栏宣言(Siam)博客
mysql聚合统计数据查询缓慢优化方案
增加索引并不能解决聚合函数统计慢的问题优化聚合统计的方案提前预算建立统计数据表，以日期区分，如：20190801一天，销售了多少订单、金额等等数据。当订单产生（支付完成后可统计数据）时，便在统计数据表中对应的日期增加金额、数量。来定时（比如每20分钟一次）计算总和，然后更新到统计数据表中。优点：做的处理比较少，也无需改动退款操作等api，只需要依赖原订单表的数据，定时统计、刷新统计数据。总结索引并不能解决统计聚合数据慢的sql语句问题聚合函数谨慎用最好不用，因为我们无法预算以后的数据量需要扫描多少行数据来计算优化方案离不开统计表，都需要按一定的周期储存运算好的统计数据
7.5K30发布于 2019-12-18
来自专栏Mr_du
点播--获取播放统计数据文件下载地址
https://cloud.tencent.com/document/product/266/12624
78820发布于 2019-07-30
来自专栏开源
ClKLog支持手机端查询统计数据啦！
ClKLog的付费版中提供了兼容移动端的h5展示界面，简单来说，手机浏览器直接访fangwe问统计地址就能直接查询主要的统计数据。登录后可以直接看到默认项目的统计数据。 ● 【筛选项目与时间】我们可以通过下拉选择需要查询的项目与统计的截止时间。 ● 【下载统计页面】点击下载即可将当前统计数据页面保存为长图。如果大家对于手机端查询统计数据有更多的需求或者建议，欢迎给小秘书留言。
29510编辑于 2025-01-20
来自专栏网络收集
actions自动更新站点统计数据
简析原理获取百度统计开放api的token，利用python将百度统计api返回的统计数据下载保存为json文件，再利用JavaScript读取并处理json数据，将处理好的数据通过echarts.js color:#4078c0;text-decoration:none;}.left.text-muted a:hover{text-decoration:underline;}h2. return parseInt(s.substr(0, 4)) } function get_month(s) { return parseInt(s.substr(5, 2) 写入如下内容： yaml name: 获取百度统计数据 on: schedule: - cron: ' 0 0,6,12,18 * * *' jobs: deploy: runs-on git config --global user.email "你的GitHub邮箱如3447851674@qq.com" git add . git commit -m "百度统计数据上传
1K30编辑于 2022-03-20
来自专栏Python工程师
Python-科学计算-pandas-04-统计数据
已知一个DataFrame，有4列["quality_1", "measure_value", "up_tol", "down_tol"] 获取测量值列的一些统计数据 Part 2：代码 ? import pandas as pd dict_1 = {"quality_1": ["pos_1", "pos_2", "pos_3", "pos_4", "pos_5"], " measure_value": ["6", "4", 6, 3.5, 2.5], "up_tol": [5, 5, 3, 3, 2], "down_tol": [-5 , -5, -3, -3, 2]} df = pd.DataFrame(dict_1, columns=["quality_1", "measure_value", "up_tol", "down_tol
71110发布于 2019-11-18
来自专栏小鑫同学编程历险记
正确发送统计数据到服务器
ArrayBuffer； 2. ArrayBufferView； 3. Blob； 4. URLSearchParams； result： <返回值> 当数据被成功加入传输队列后返回 true，否则返回 false 案例分析：在会话结束时发送统计数据到服务器，我们可以监听 visibilitychange console.log(`app listening on port ${port}`); }); API 兼容性：注意事项：避免使用 unload 和 beforeunload 在会话结束时发送统计数据
1.3K20编辑于 2022-12-26

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

推荐几个统计数据的网站

select 统计数据

spark实战之：分析维基百科网站统计数据(java版)

爬某ZF网站统计数据

寻找海量数据集用于大数据开发实战(维基百科网站统计数据)

快速合并统计数据

ChatGPT 统计数据 2024（最全！）

O2O网站

大型网站架构系列：电商网站架构案例(2)

pandas使用技巧-分组统计数据

基于 Django 的个人网站（2）

陈志豪的个人网站

关于SSL证书10大统计数据

自适应流播放统计数据集

koa2实现网站csrf防御

mysql聚合统计数据查询缓慢优化方案

点播--获取播放统计数据文件下载地址

ClKLog支持手机端查询统计数据啦！

actions自动更新站点统计数据

Python-科学计算-pandas-04-统计数据

正确发送统计数据到服务器

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐