搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏程序员的园——原创文章
不造轮子之STL中统计算法
#include <iostream> #include <vector> #include <algorithm> int main() { std::vector vec = {1, 3, 5, 3. std::none_of 功能：检查范围内的所有元素是否都不满足某个条件。 #include <iostream> #include <vector> #include <algorithm> int main() { std::vector vec = {1, 2, 3, #include <iostream> #include <vector> #include <algorithm> int main() { std::vector vec = {1, 2, 3,
31910编辑于 2024-09-30
来自专栏开发运维工程师
统计算法｜一文了解Java中的commons-math3的StatUtils类（二）
上一篇介绍了Commons-math3如何引入以及包架构，本篇想详细介绍下其中的类StatUtils。例如我们可以从第2位开始计算，计算步长为3个单位，即只计算98，2，98的数值的和。 // 求和，从第二位开始，长度为3的数组的数值的和 double sum1 = StatUtils.sum(testData, 2, 3); System.out.println("指定项的数值的和sum1 double[] values, final int begin, final int length)throws MathIllegalArgumentException （3） ("平均方差v3 = " + v3); （9）总体方差总体方差是一组资料中各数值与其算术平均数离差平方和的平均数，是衡量数据波动性或分散程度的度量。
76821编辑于 2024-01-31
来自专栏BestSDK
当今最火10大统计算法，你用过几个？
3. 重采样方法重采样方法（Resampling）包括从原始数据样本中提取重复样本。这是一种统计推断的非参数方法。即，重采样不使用通用分布来逼近地计算概率 p 的值。下面 3 个方法可以提供更好的预测准确率和模型可解释性。 4. 通俗地说，它用于寻找对两类点集做出最佳分离的超平面（hyperplane，在 2D 空间中是线，在 3D 空间中是面，在高维空间中是超平面。
1.5K100发布于 2018-03-02
来自专栏数据科学与人工智能
【数据科学】统计算法在Kaggle数据科学竞赛成功
我做这些有几个原因:1)有时我发现一些相对简单的解决方案,执行效果很好；2)在实践中我发现客户喜欢简单的解决方案,这样他们能够把握掌控它；3)如果一个解决方案是做得很好,我想了解是什么驱动它成功,对于简单的模型算法这是很容易发现的 3.是什么启发你开始参加Kaggle比赛吗? 我第一次听说Kaggle是在2011年一篇《华尔街日报》文章中。数据科学比赛听起来很有趣。
1.1K50发布于 2018-02-26
来自专栏CSDN搜“看，未来”
如何分析、统计算法的执行效率和资源消耗？
第 2、3、4 行代码，每行都需要 1 个 unit_time 的执行时间，第 5、6 行代码循环执行了 n 遍，需要 2n * unit_time 的执行时间，第 7、8 行代码循环执行了 n^2 所以，整段代码总的执行时间 T(n) = (2n^2+2n+3)*unit_time。 n是一个可以取无穷大的未知数，相对于N^2来说，2n+3微不足道，所以舍去，而 2N^2和N^2则可以同化表示为N^2 我们在分析一个算法、一段代码的时间复杂度的时候，也只关注循环执行次数最多的那一段代码就可以了
91720发布于 2021-09-18
来自专栏编程
当今最火10大统计算法，你用过几个？
3. 重采样方法重采样方法（Resampling）包括从原始数据样本中提取重复样本。这是一种统计推断的非参数方法。即，重采样不使用通用分布来逼近地计算概率 p 的值。下面 3 个方法可以提供更好的预测准确率和模型可解释性。 4. 通俗地说，它用于寻找对两类点集做出最佳分离的超平面（hyperplane，在 2D 空间中是线，在 3D 空间中是面，在高维空间中是超平面。
6.7K00发布于 2017-12-27
来自专栏周末程序猿
技术总结|十分钟了解UV统计算法HyperLogLog
3、HyperLogLog Counting分桶为什么要分桶？
46310编辑于 2025-02-27
来自专栏Android 技术栈
复杂度分析（上）：如何分析、统计算法的执行效率和资源消耗？
比如这段代码，即便有 3 行，它的时间复杂度也是 O(1），而不是 O(3)。 i=1; while (i <= n) { i = i * 3; } 根据我刚刚讲的思路，很简单就能看出来，这段代码的时间复杂度为 O(log3n)。实际上，不管是以 2 为底、以 3 为底，还是以 10 为底，我们可以把所有对数阶的时间复杂度都记为 O(logn)。为什么呢？我们知道，对数之间是可以互相转换的，log3n 就等于 log32 * log2n，所以 O(log3n) = O(C * log2n)，其中 C=log32 是一个常量。 3.O(m+n)、O(m*n) 我们再来讲一种跟前面都不一样的时间复杂度，代码的复杂度由两个数据的规模来决定。老规矩，先看代码！
1.1K20发布于 2019-04-09
来自专栏TSINGSEE青犀视频
安防监控视频AI智能分析网关：人流量统计算法的应用场景汇总
旭帆科技AI边缘计算网关硬件 —— 智能分析网关目前有5个版本：V1、V2、V3、V4、V5，每个版本都能实现对监控视频的智能识别和分析，支持抓拍、记录、告警等，每个版本在算法模型及性能配置上略有不同。
66710编辑于 2023-09-21
来自专栏软件工程
Sentinel算法
一 .统计算法有哪些，分别问题是什么？但是0.30s~1.30s qps达到了170qps，这就突破了我们的流控；缺点，可能限不住 2.计数器滑动窗口算法解决固定窗口算法的临界问题,但是也有个缺点，缺点：时间窗口大小设置不好搞 3. 令牌桶算法程序以r(=时间周期/限流值)的速度向令牌桶中增加令牌，直到令牌桶满，请求到达时向令牌桶请求令牌，如获取到令牌则通过请求，否则触发限流策略二、Sentinel用的什么统计算法，跟Hystrix
55810编辑于 2022-03-04
来自专栏全栈程序员必看
基于matlab直方图均衡,matlab 直方图均衡实验报告.pdf「建议收藏」
均衡步骤： 1、统计原始图像的直方图，求出P (r )； r k k 2、用累积分布函数作变换s P (r ) ，求变换后的新灰度； k r j j 0 3、用新灰度代替旧灰度，求出P (s ) ，这一步是近似的原始图像灰度直方图统计算法一 for l 0:255 for i 1:row iffid(i,1) l h(l+1) h(l+1)+1; end end end 2. 原始图像灰度直方图统计算法二 for i 1:row h(fid(i)+1) h(fid(i)+1)+1; end 由主要代码部分可以看出：算法二算法复杂度很小，这是利用fopen 打开文件的 m 1 四实验结果及分析：灰度直方图统计：原始图像与均衡后图像灰度直方图 (以LENA 女孩图像为例) 图3 原始图像直方图图4 图像均衡后直方图不同亮度图像直方图均衡效果显示 1. LENA 图像 1 ()正常图5LENA 正常原始及均衡后图像显示 2 ()高亮度图6LENA 高光原始及均衡后图像显示 3 ()偏暗图7LENA 偏暗原始版权声明：本文内容由互联网用户自发贡献
57470编辑于 2022-11-02
来自专栏CSDN技术头条
如何选择Spark机器学习API
本文将简要介绍Spark机器学习库（Spark MLlib’s APIs）的各种机器学习算法，主要包括：统计算法、分类算法、聚类算法和协同过滤算法，以及各种算法的应用。 ? 你不是一个数据科学家。有一个你在用Spark SQL和Spark流处理的时候很可能同时用到的东西，就是Spark MLlib，Spark MLlib是一个API形式的机器学习库和统计算法。 统计算法 这些API主要是用来进行A-B检验或者A-B-C检验。通常在商业中，我们认为，如果两个东西的平均值相等，那么这两个东西就大体相当了。其实不一定。
85060发布于 2018-02-08
来自专栏CDA数据分析师
强大的图形功能软件：S-Plus
它的丰富的数据类型（向量、数组、列表、对象等）特别有利于实现新的统计算法，其交互式运行方式及强大的图形及交互图形功能使得我们可以方便地探索数据。　　它的丰富的数据类型（向量、数组、列表、对象等）特别有利于实现新的统计算法，其交互式运行方式及强大的图形及交互图形功能使得我们可以方便地探索数据。　　目前S语言的实现版本主要是S-PLUS。（3）另外S-PLUS的DDE及OLE自动化界面，可以使S-PLUS与其他Windows应用软件无缝集成，允许你从Excel或是Visual Basic应用软件中执行S-PLUS功能。　　
1.9K100发布于 2018-02-05
来自专栏全栈开发工程师
【Redis】005-Redis三大特殊数据类型：geospatial地理位置、HyperLogLog基数统计、Bitmaps位图
127.0.0.1:6379> geoadd china:city 121.47 31.23 shanghai 106.50 29.53 chongqing # 添加多个 (integer) 2 图解： 3、以此类推即可代码： 127.0.0.1:6379> geohash china:city beijing shanghai 1) "wx4fbxxfke0" 2) "wtw3sj5zbj0" 图解： 127.0.0.1:6379> zrange china:city 0 -1 1) "chongqing" 2) "shanghai" 二、HyperLogLog基数统计 1、概述什么是基数：集合A={1,2,3,4,5,3 }的基数（一个集合中不重复的元素个数）为5；简介： Redis2.8.9版本更新出来了HyperLogLog数据结构； Redis HyperLogLog基数统计算法；举例：网站的UV（访问人数）； HyperLogLog基数统计算法优点：占用的内存是固定的2^64不同的元素，只需要消耗12k的内存；存在0.81%的错误率（是可接受的，如果不容错误，则可以使用set或者其他）；传统的方式：使用
39810编辑于 2025-01-06
来自专栏AI科技评论
最新出炉——数据科学家最常使用的十大算法
Clustering 聚类算法 3. Decision Trees/Rules 决策树 4. Visualization 可视化 5. k-Nearest Neighbor 邻近算法 6. Statistics 统计算法 8. Random Forests 随机森林算法 9. Time series/Sequence 时间序列 10. Text Mining 文本挖掘 ? 我们注意到：工业界数据科学家更倾向于使用回归算法、可视化、统计算法、随机森林算法以及时间序列政府/非盈利组织更倾向于使用可视化、主成分分析算以及时间序列学术界研究人员更倾向于使用主成分分析算法和深度学习
1.2K90发布于 2018-03-07
来自专栏API安全
技术专题：API资产识别大揭秘（二）
二、API聚合技术整体思路：基于统计算法，将通信流量中API初步归类，一般来说按照同一个业务系统进行分类，然后将其所有的 API 无论是 URL 的部分还是 Body 的部分，全部抽象成一个数据结构，通过统计的方法去缩小 3. 聚合效果那通过上述API聚合技术的介绍，我们聚合后最终能够达到什么样的效果呢？我们以测试网站的API为例：从流量中获取到该网站存在以下API（通过处理，图中显示API的URL路径部分）通过统计算法处理之后，我们将得到路径相同、URL长度相同、拥有相同路径节点等条件的API聚合范围根据统计后的聚合范围，我们对满足条件的API中的可变路径部分进行相似度计算并聚合，最终结果如下所示：小结本次主要旨在揭示基于统计算法的API资产分析和聚合技术。
1.1K31编辑于 2023-08-30
来自专栏颇忒脱的技术博客
算法 - 时间复杂度
注：本文仅为笔记原文极客时间 - 数据结构与算法之美 - 03 | 复杂度分析（上）：如何分析、统计算法的执行效率和资源消耗？复杂度量级常数阶 O(1) 线性阶 O(n) 对数阶 O(logn) 线性对数阶 O(nLogn) 平方阶 O(n^2)、立方阶 O(n^3)、k次方阶 O(n^k) 指数阶 O(2^n) 阶乘阶 O
93720发布于 2019-03-13
来自专栏vivo互联网技术
vivo 故障定位平台的探索与实践
4.2 算法实现（1）切分时间线：将异常时间线从中点一分为二，如下图：(2) 计算波动标准差：运用二级指数平滑算法对前半段进行数据预测，然后根据观测值与预测值计算出波动标准差，如下图：(3)计算异常波动范围：后半段大于3倍波动标准差的时间线属于异常波动，下图红线代表3倍波动标准差，所以异常波动是红线以上的时间线，如下图：（4）时间点标记：红线与时间线第一次相交的时间点是波动开始时间，红线与时间线最后一次相交的时间点是波动结束时间防患于未然；2、数据质量治理：当前我们的监控数据都有，但数据质量却参差不齐，而且数据格式的差异很大(比如日志数据和指标数据)，我们在做机器学习或AIOps时，想要从中找出一些有价值的规律，其实挺难的；3、经验知识化：当前我们的专家经验很多都在运维和开发同学的脑海中，如果将这些经验知识化，对于机器学习或AIOps将是一笔宝贵的财富；4、从统计算法往AI算法演进：我们故障定位现在实际用的是统计算法，并没有用到统计往往是一种强关系描述，而AI偏向弱关系，可以以统计算法为主，然后通过AI算法优化的方式。
1.1K30编辑于 2023-01-09
来自专栏迁移内容
Redis（十）：Redis特殊类型之Hyperloglog基数统计
Hyperloglog：基数统计算法！0.81%的错误率，不过统计大量数据可以忽略！ 1、什么是基数比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。 A{1，3，6，7，5，6} B{1，3，5，7，6} 两个的基数都（不重复的元素）=5，可以接受误差！ 2、Hyperloglog简介 Redis Hyperloglog 基数统计的算法！ 3、常用命令 127.0.0.1:6379> PFADD thekey1 a b c d e f g h i j k l m //创建第一组元素 (integer) 1 127.0.0.1:6379> thekey1 thekey2 //合并两组 OK 127.0.0.1:6379> PFCOUNT thekey3 (integer) 25 //百分之零点八的误差出现了？
45030编辑于 2022-12-01
来自专栏API安全
API用户行为分析监测
监测方案：基于账号识别技术和统计算法，计算内部账号在规定的时间范围对各类数据交互API接口成功请求敏感数据的次数，当超过设定访问阈值，可能存在内部账号大量获取敏感信息风险，结合API敏感数据流向监控，判断该账号是否存在敏感数据外泄行为风险监测方案：基于账号识别技术和统计算法，计算内部账号在规定的时间范围对文件下载API接口成功请求的次数，当超过设定下载阈值，则表明可能存在内部账号高频下载内部文件风险。监测方案：基于账号识别技术和统计算法，计算不同账号在规定的时间范围对同一重点API失败请求的次数，当超过设定失败请求阈值，则表明可能存在批量账号猜测攻击安全风险。监测方案：基于账号识别技术和统计算法，追踪账号在规定时间范围内失败登陆次数，同时计算单位时间内同一账号多次失败登陆的IP地址数量，若登陆失败次数超过设定阈值，或者超过设定登陆失败次数后的账号的存在多个IP
1.7K20编辑于 2023-10-24

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

不造轮子之STL中统计算法

统计算法｜一文了解Java中的commons-math3的StatUtils类（二）

当今最火10大统计算法，你用过几个？

【数据科学】统计算法在Kaggle数据科学竞赛成功

如何分析、统计算法的执行效率和资源消耗？

当今最火10大统计算法，你用过几个？

技术总结|十分钟了解UV统计算法HyperLogLog

复杂度分析（上）：如何分析、统计算法的执行效率和资源消耗？

安防监控视频AI智能分析网关：人流量统计算法的应用场景汇总

Sentinel算法

基于matlab直方图均衡,matlab 直方图均衡实验报告.pdf「建议收藏」

如何选择Spark机器学习API

强大的图形功能软件：S-Plus

【Redis】005-Redis三大特殊数据类型：geospatial地理位置、HyperLogLog基数统计、Bitmaps位图

最新出炉——数据科学家最常使用的十大算法

技术专题：API资产识别大揭秘（二）

算法 - 时间复杂度

vivo 故障定位平台的探索与实践

Redis（十）：Redis特殊类型之Hyperloglog基数统计

API用户行为分析监测

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐