搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏机器学习、深度学习
统计学习导论 Chapter3--Linear Regression
这两条线的概念是 统计学习方法用采样数据来估计 a large population 的一些特性的一个自然延伸。 3. How well does the model fit the data? 4. Correlation of error terms. 3. Non-constant variance of error terms. 4. Outliers. 5.
1.4K70发布于 2018-01-03
来自专栏人人都是数据分析师
统计学(3)|AB测试—实验结果分析
在上一篇文章统计学(2)|A/B测试—理论基础中，我们理清了AB测试的理论基础——假设检验的思想，并且严格推导了为什么现在公司做AB测试基本全都使用统计量。 2实验结果分析当我们提出假设，并且构造完统计量之后，我们就要进行决策了，在统计学中，进行决策通常有两种方式：一种是将统计量的值与给定显著性水平下统计量的分布的临界值作比较，以此来判断是否接受原假设。 2.3 置信区间 统计学中用样本去推断总体有两个工具：参数估计与假设检验。这里我们稍加笔墨来介绍一下参数估计，目的是为了引出在AB测试中最关注的元素之一：置信区间。（3）置信区间置信区间可以辅助确定版本间是否有存在显著差异的可能性。综上，我们认为当AB测试实验数据在95%的置信水平区间内，P值小于0.05，功效大于80%的情况下，实验结果是可信赖的。通过这两篇文章，整个AB测试所涉及的统计学原理，以及如何将相关统计学概念应用到AB测试实验结果的分析中，我们已经介绍完了。
2.2K30发布于 2021-05-13
来自专栏阶梯计划
小白的大数据笔记——3(统计学1)
1 前言大数据分析少不了统计学的知识，最近在看可汗的统计学视频，重新温习书本知识。 2 P1~P19的知识点概述 2.1 统计分类描述统计学：是阐述如何对客观现象的数量表现进行计量、搜集、整理、表示、一般分析与解释的一系列统计方法。归纳统计学：又称推断统计学主要阐述如何根据部分数据(样本统计量)去推论总体的数量特征及规律性的一系列理论和方法，其主要内容包括概率与概率分布、参数估计、假设检验、抽样调查、方差分析、相关与回归分析、统计预测参考文献： md公式编辑参考可汗统计学
84210发布于 2021-02-24
来自专栏数据科学与人工智能
R语言做统计学3本电子书
我们知道，做好数据工作，需要统计学的知识和方法以及应用统计学解决问题的思维和能力。 R语言最初是由两位统计学教授以S语言为原型实现的开源语言，后来得到很多人参与，贡献和关注，已经有一个活跃的生态圈，并且是一种积极向上的生态。如何使用R语言学习统计学和应用统计学？我推荐3本电子书。 No.1 Applied Statistics Theory and Problem Solutions with R ? No.3 A Course in Statistics With R ? 温馨提示：这些电子书，仅供学习使用。若你是一位重视应用统计学解决实际问题的学生或者工作者，你可以阅读第一本书，这本书更加重视统计学的实用性，以及利用统计学来解决各种问题，并且使用R语言来写代码实现。
99420发布于 2020-03-25
来自专栏人人都是数据分析师
统计学(1)|白话统计学发展(含统计学必知必会)
本文是个人思考后输出的合乎逻辑的统计学发展历程，旨在为广大对统计学感兴趣的同学提供一个顺滑的学习路线和一个整体的逻辑框架。 ? 2何为统计？首先，对于统计的这个话题，需要明确我们在讨论什么？ 3统计的发展历程我们先用一张图片展示一下，统计学的发展历程，然后逐一叙述： ? 1）很久很久以前，古代人们就掌握了计数的技术，主要用于记录食物的数量。 3）有了均值和方差，我们需要总结一下这时的成果；存在某个事件的一组记录数据，我们可以计算统计值——均值和方差来分别衡量这组数字的平均水平和差异程度。 13）统计学发展至此，已经覆盖大部分日常生活中的应用，ZZ叙述的这个发展过程，希望指引广大爱好的统计学的同僚更加顺滑的学习统计学知识。 5小结以上统计学发展和必知必会覆盖大部分日常统计工作，也涉及了应用最广范的假设检验，但是本文旨在为学习统计学的同学提供一个指引，对于其中具体理论和实际应用并未多涉及。
92720发布于 2021-05-13
来自专栏SnailTyan
统计学习方法(一)——统计学习方法概论
统计学习的特点：(1)以计算机和网络为平台；(2)以数据为研究对象，是数据驱动的学科；(3)目的是对数据进行分析和预测；(4)以方法为中心，构建模型并应用模型进行分析和预测；(5)是概率论、统计学、信息论 3.统计学习的目的 统计学习总的目标就是考虑学习什么的模型和如何学习模型，以使模型能够对数据进行准确的预测和分析，同时也要考虑学习效率。 6.统计学习的重要性 统计学习的重要性体现在三个方面：（1）统计学习是处理海量数据的有效方法。（2）统计学习是计算机智能化的有效手段。（3）统计学习是计算机发展的重要组成部分。 统计学习假设数据存在一定的统计规律。 3.假设空间监督学习的目的在于学习一个由输入到输出的映射，映射关系用模型表示。输入到输出的映射集合就是假设空间（hypothesis space）。首先给定数据集T=(x1,y1),(x3,y2),...,(xN,yN)T={(x_1,y_1),(x_3,y_2),...,(x_N,y_N)}T=(x1,y1),(x3,y2),...
1.2K20发布于 2019-05-25
来自专栏闪电gogogo的专栏
《统计学习方法》笔记一 统计学习方法概论
统计学习 统计学习时关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析。 统计学习的三要素：方法 = 模型+策略+算法 统计学习由监督学习、非监督学习、半监督学习和强化学习等组成。实现统计学习方法的具体步骤如下：（1）得到一个有限的训练数据集合；（2）确定包含所有可能的模型的假设空间，即学习模型的集合；（3）确定模型选择的准则，即学习的策略；（4）实现求解最优模型的算法，标注问题：输入、输出变量均为变量序列的预测问题监督学习的任务就是学习一个模型，应用这一模型，对给定的输入预测相应的输出，这个模型的一般形式为决策函数：Y=f(X)或者条件概率分布P(Y|X) 统计学习三要素标注常用的统计学习方法有：隐马尔可夫模型、条件随机场。回归问题回归用于预测输入变量和输出变量之间的关系，回归模型表示从输入变量到输出变量之间映射的函数，回归问题的学习等价于函数拟合。
1K20发布于 2018-10-11
来自专栏数据派THU
谷歌统计学家表示“统计学很无聊“
来源：数学加油吧机器学习算法与Python实战本文约3500字，建议阅读7分钟本文为你分享谷歌的统计学家 Cassie Kozyrkov 对于统计学的观点。 统计学是通过搜索、整理、分析、描述数据等手段，以达到推断所测对象的本质，甚至预测对象未来的一门综合性科学。嗯，以上是统计学课本中对统计学的定义！但是近日，一位来自谷歌的统计学家却发长文表示“统计学很无聊。“ 这位统计学家叫 Cassie Kozyrkov，目前是 Google 的首席决策师。让我们先普及一些统计学的入门级概念，然后跟着这位统计学家一起，看看她的逻辑证明。总体当一个普通人想到“population”这个词时，他会想到什么？人，对吗？我花了十多年的时间致力于统计学，它并不是一门一无是处的学科。所以，在合适的时候使用统计方法才是有用的，非常有用的。最后，你什么时候真的需要统计学呢？
53420编辑于 2023-03-29
来自专栏AI金融科技
统计学方法
再利用熵权对各指标的权重进行修正，得到较为客观的指标权重 3. 适用范围 a. 还可以和各属性的重要性A综合考虑得到综合权数 WA = (W * A)/(W * A).sum() 3. 成本：y = (max(X) - x)/(max(X) - min(X)) 3. 对x2 < x < x3 x' = 1 3. 对x3 < x < x4 x' = 1 - (x - x3)/(x4 - x3) d.
1.2K10发布于 2021-03-05
来自专栏Hank’s Blog
统计学(一)
分位数使用QUARTILE函数算出第一分位数:25%分位数第二分位数:中位数第三分位数:75%分位数
41920发布于 2020-09-16
来自专栏机器学习与统计学
基础统计学
3. 选择最小值或低于最小值的某一个较为方便使用的值作为第一组的下限。 4. 空难原因频数分布表表 2-3 中列出了从 1960 年到最近几年有关空难原因的数据。数据是名目测量尺度下的分类数据，但也可以创建如表 2-3 所示的频数分布表。可以看到，飞行员失误是空难的主要原因。用帕累托图展示空难原因图2-8展示了基于表2-3的帕累托图。图 2-8 和表 2-3 使用了相同的数据，但图 2-8 能让读者更加鲜明地看到，飞行员失误是空难的最重要原因。概率在统计学中的角色概率在假设检验中起到了关键作用。统计学家根据数据做决策：根据低概率排除偶然发生的可能性。请看以下关于概率的作用和统计学家思维方式的例子。希望每一位学习统计学的小伙伴来都拥有这本案头宝典。
43910编辑于 2025-06-15
来自专栏arXiv每日学术速递
统计学学术速递
点击阅读原文即可访问 stat统计学，共计28篇【1】 Probabilistic Forecast Combination for Anomaly Detection in Building Heat choice of informed proposals in model selection and the use of importance sampling in MCMC methods. 【3】 Department of Future & Smart Construction Research, KICT, Gyeonggi Province, Republic of Korea 备注：6 pages, 3 The Chinese University of Hong Kong, hk 2School of Mathematics and Statistics, Wuhan University, cn 3Department Credit Rating 标题：一种稀疏性算法及其在企业信用评级中的应用作者：Dan Wang,Zhi Chen,Ionut Florescu 备注：16 pages, 11 tables, 3
78930发布于 2021-07-27
来自专栏arXiv每日学术速递
统计学学术速递
stat统计学，共计15篇【1】 Spatio-temporal Parking Behaviour Forecasting and Analysis Before and During COVID The implementation of the proposed method is available at https://github.com/ebprado/SP-BART. 【3】 Non-Asymptotic Alexandria, VA , d Dell Medical School, University of Texas, Austin, TX 备注：71 pgs (with supplemental) 3
60630发布于 2021-08-24
来自专栏arXiv每日学术速递
统计学学术速递
stat统计学，共计42篇【1】 Nonparametric Sparse Tensor Factorization with Hierarchical Gamma Processes 标题：基于分层我们的工具RadViz3D在3D单位球体上均匀分布锚定点。我们表明，这种均匀分布为具有不相关变量的数据提供了最佳的可视化效果和最小的人工视觉相关性。我们的方法在R包$radviz3d$中实现，使完全3D RadViz成为可能，并被证明提高了这种非线性技术更真实地显示模拟数据以及螃蟹、橄榄油和葡萄酒数据集的能力。 Our tool, RadViz3D, distributes anchor points uniformly on the 3D unit sphere. Delta variant. 【7】 Advanced Statistical Learning on Short Term Load Process Forecasting 标题：短期负荷过程预测的高级统计学习
1.6K10发布于 2021-10-22
来自专栏arXiv每日学术速递
统计学学术速递
stat统计学，共计36篇【1】 Bayesian Learning: A Selective Overview 标题：贝叶斯学习：选择性综述链接：https://arxiv.org/abs/2112.12722 terms of predictive power and epidemiological interpretation, than state-of-the-art alternatives. 【3】 Physics, University of Cambridge, Ratti) Department of Mathematics, University of Genoa 摘要：统计逆学习理论是逆问题与统计学习交叉的一个领域我们用线性模型类形式化了背景bandit设置中的问题，方法是确定任何模型选择算法都应最佳权衡的三个误差源：（1）近似误差，（2）统计复杂性和（3）覆盖率。在常规考虑的$n\leq 1000$范围内，$k=3$的各种数值模拟表明，SMPI的实验性能在现有算法的基础上大幅提高，并与理论最佳回收率相当。
94820编辑于 2021-12-27
来自专栏arXiv每日学术速递
统计学学术速递
点击阅读原文即可访问 stat统计学，共计48篇【1】 Spectral goodness-of-fit tests for complete and partial network data 标题： specifically, the ancillary statistic that constitutes a relevant subset, into an adaptive design. 【3】 3.我们表明，对石油泄漏后存活率、招募率和密度随时间变化的推断有助于深入了解石油泄漏后死亡率的增加、此后人口的可能再分配以及人口的持续下降。作者：Young-Geun Choi,Seunghwan Lee,Donghyeon Yu 链接：https://arxiv.org/abs/2106.09382 摘要：大规模稀疏精度矩阵估计引起了统计学界的广泛兴趣 for Information technology HIIT, Department of Computer Science, University of Helsinki 备注：18 pages, 3
1.5K10发布于 2021-07-02
来自专栏数据的力量
如何学习统计学
因该说，这是应用统计学教育的成功，尽管在统计学的（有意）误用方面，他们常受指摘。这里我熟一点的是安德森的《商务与经济统计》和林德的《商务与经济统计技术》，也有影印版，都多次重印的经典教材。为简单起见，假定只有0、1、2三个数字，且每个数字出现在每张纸条上的可能性都是1/3。当时我尝试了一下，发现自己对统计学的基本概念，都还停留在数学描述的阶段。一个统计学家，不能指望他的听众都一样统计出身，同样，对大多数需要应用统计工具的非统计学家来说，也不能假设他的客户一样是统计爱好者，专业词汇只在一个很窄的圈子里通用。上面提到的是对统计理论的直观理解。来源：微信公众号---小小统计学，作者：胡江堂
78530发布于 2018-06-20
来自专栏arXiv每日学术速递
统计学学术速递
stat统计学，共计25篇【1】 A New Asymmetric Copula with Reversible Correlations and Its Application to the EU sharp confidence intervals for GP models applicable to RKHS elements which may be of broader interest. 【3】 automatic processes) is prohibited without ex-, plicit Publisher approval., Boston — Delft 摘要：本专著开发了一个全面的统计学习框架】 Statistical Learning to Operationalize a Domain Agnostic Data Quality Scoring 标题：将领域无关数据质量评分付诸实施的统计学习
66730发布于 2021-08-24
来自专栏arXiv每日学术速递
统计学学术速递
stat统计学，共计27篇【1】 Stochastic Processes Under Linear Differential Constraints : Application to Gaussian Process Regression for the 3 Dimensional Free Space Wave Equation 标题：线性微分约束下的随机过程：在三维自由空间波方程高斯过程回归中的应用 dedicated to performing "physically informed" machine learning on data that is solution to the homogeneous 3 dimensions that are reliable across different data sources without additional exogenous assumptions. 【3】
89010发布于 2021-11-25
来自专栏arXiv每日学术速递
统计学学术速递
stat统计学，共计31篇【1】 Doubly-Valid/Doubly-Sharp Sensitivity Analysis for Causal Inference with Unmeasured Dalalyan 机构：CREST, ENSAE Paris, Institut Polytechnique de Paris 摘要：分析神经网络的统计特性是统计学和机器学习的一个中心主题。 Comments welcome at this https URL 摘要：在统计学中的两个主要学派，即贝叶斯学派和经典/频率学派之间，一个主要区别是前者基于数学上严格的概率理论，而后者则不是。我们提出了具有双标准决策的贝叶斯最优II期试验设计（BOP2-DC），它将统计学意义和临床相关性结合到决策中。我们证明了我们的算法实现了$\tilde{O}（\sqrt{SAH^3K}+\sqrt{AH^4}）$遗憾。当$S>H$时，忽略对数因子，我们的算法是极小极大最优的。
79130编辑于 2021-12-24

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

统计学习导论 Chapter3--Linear Regression

统计学(3)|AB测试—实验结果分析

小白的大数据笔记——3(统计学1)

R语言做统计学3本电子书

统计学(1)|白话统计学发展(含统计学必知必会)

统计学习方法(一)——统计学习方法概论

《统计学习方法》笔记一统计学习方法概论

谷歌统计学家表示“统计学很无聊“

统计学方法

统计学(一)

基础统计学

统计学学术速递

统计学学术速递

统计学学术速递

统计学学术速递

统计学学术速递

如何学习统计学

统计学学术速递

统计学学术速递

统计学学术速递

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

统计学习导论 Chapter3--Linear Regression

统计学(3)|AB测试—实验结果分析

小白的大数据笔记——3(统计学1)

R语言做统计学3本电子书

统计学(1)|白话统计学发展(含统计学必知必会)

统计学习方法(一)——统计学习方法概论

《统计学习方法》笔记一 统计学习方法概论

谷歌统计学家表示“统计学很无聊“

统计学方法

统计学(一)

基础统计学

统计学学术速递

统计学学术速递

统计学学术速递

统计学学术速递

统计学学术速递

如何学习统计学

统计学学术速递

统计学学术速递

统计学学术速递

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

《统计学习方法》笔记一统计学习方法概论