搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生信小驿站
gbm算法
GBDT（Gradient Boosting Decision Tree）又叫 MART（Multiple Additive Regression Tree），是一种迭代的决策树算法，该算法由多棵决策树组成 gbm扩展了Freund and Schapire的Adaboost算法和Friedman的梯度提升机（gradient boosting machine）。 [图片上传失败... (image-32b7ea-1540222324149)] gbm包实际上，梯度提升算法并不特指某个特定模型，而是一种机器学习思想，被人们运用到许多传统的模型中而形成了一类强大的机器学习方法。有趣的是，gbm包的全称也并不是Gradient Boost Machine，而是generalized boosted regression models—广义提升回归模型，即运用了boosting算法的广义回归模型 GBM有以下特点：可以和随机森林这样的高性能算法竞争。能保持可靠的预测表现，并且能避免无意义的预测。能明确地处理缺失数据。无需进行特征缩放。能处理的因子水平比随机森林更高。
5.8K00发布于 2018-11-12
来自专栏数据结构和算法
探索Python中的基础算法：梯度提升机（GBM）
在机器学习领域中，梯度提升机（Gradient Boosting Machine，GBM）是一种强大的集成学习算法，常用于解决回归和分类问题。本文将详细介绍GBM的原理、实现步骤以及如何使用Python进行编程实践。什么是梯度提升机？梯度提升机是一种集成学习方法，它通过将多个弱学习器组合起来构建一个强大的模型。在GBM中，每个弱学习器都是基于决策树的，它们是通过梯度下降的方法来逐步构建的。总结梯度提升机是一种强大的集成学习算法，它在许多实际问题中都表现出色。通过本文的介绍，你已经了解了梯度提升机的原理、实现步骤以及如何使用Python进行编程实践。希望本文能够帮助你更好地理解和应用梯度提升机算法。
1K11编辑于 2024-03-21
来自专栏量化投资与机器学习
【原创精品】使用R语言gbm包实现梯度提升算法
● 朴素贝叶斯算法在Python和R的应用所有编辑部原创文章，未经授权任何个人和机构不得以任何方式转载 gbm-Gradient Boost Machinet 梯度提升算法梯度提升算法Gradient 找到最佳步长ρt使得 gbm包实际上，梯度提升算法并不特指某个特定模型，而是一种机器学习思想，被人们运用到许多传统的模型中而形成了一类强大的机器学习方法。有趣的是，gbm包的全称也并不是Gradient Boost Machine，而是generalized boosted regression models—广义提升回归模型，即运用了boosting算法的广义回归模型 gbm包中最主要的函数为gbm/gbm.fit。函数提供了很多参数以进行模型调优。（1）distribution：模型计算损失函数时，需要对输出变量的数据分布做出假设。迭代次数的选择与学习速率密切相关，下图展示了模型表现、学习速率和迭代次数之间的关系：迭代次数可以设得稍微大一点，因为模型训练完后，gbm中的gbm.perf可以估计出最佳迭代次数以供预测阶段使用。
5.6K71发布于 2018-01-29
来自专栏YoungGy
R语言包_gbm
gbm效果和randomForest相近，但是占用内存更少，且支持多核crossValidation运算。 names(getModelInfo()) titanicDF$Survived <- ifelse(titanicDF$Survived==1,'yes','nope') # pick model gbm and find out what type of model it is getModelInfo()$gbm$type # split data into training and testing ######################## # glm model ################################################ # pick model gbm ########## # advanced stuff ################################################ # boosted tree model (gbm
1.9K20发布于 2019-05-26
来自专栏量化投资与机器学习
梯度提升（GBM）预测订单薄价格变动（代码+数据）
通过梯度提升和微调（Fine-Tuning）建模我们的目标是证明训练一个GBM是对真实目标y和近似值之间的某个损失函数进行梯度下降最小化： ? 这意味着添加弱模型： ? 对于我们的GBM加性模型： ? 在某种程度上是梯度下降。让近似值越来越接近真实y是有意义的，这就是梯度下降。例如，每一步的残差都变小。我们必须最小化与真实目标和近似距离相关的函数。这个算法有几个参数对质量有很大的影响： n_estimators：在解决机器学习问题时可以构建树的最大数量。 depth：树的最大深度。 learning_rate：用于减少梯度步骤。
2.6K32发布于 2019-07-10
来自专栏拓端tecdat
样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
p=22336 Boosting算法是一种把若干个分类器整合为一个分类器的方法，也就是一种集成分类方法（Ensemble Method）。因此，让我们尝试一些稍微不同的方法，来介绍adaboost算法，AdaBoost是最著名的Boosting族算法。在我们最初的讨论中，目标是最小化一个凸的损失函数。我们在这里所做的与梯度下降（或牛顿算法）有关。之前，我们是从误差中学习的。在每个迭代中，计算残差，并对这些残差拟合一个(弱)模型。这个弱模型的贡献被用于梯度下降优化过程。 R函数：梯度提升(_GBM_)算法也可以使用R函数。 gbm(y~ . 图6 ---- 本文摘选《R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化》
82960编辑于 2022-03-05
来自专栏常用算法专栏
强化学习算法解析：Gradient Boosting Machine（梯度提升机, GBM）算法原理、手动计算与PythonJava双代码实战指南
关键词：机器学习、梯度提升机、GBM算法、GBDT、负梯度拟合、残差学习、PythonGBM、JavaWekaGradientBoosting、XGBoost基础、Boosting。尽管已有更高效的变体，但理解原始GBM，是掌握所有梯度提升算法的必经之路。记住：最好的模型，不是一次建成的，而是一步步优化出来的。现在，你已经能：手动执行GBM多轮残差拟合理解负梯度如何指导新树训练在Python/Java中实现并调优GBM区分GBM与AdaBoost、随机森林的本质差异常用算法专栏：欢迎到访「算法与数学底层系列」在AI大模型飞速发展的今天，一切智能的本质，最终都落脚于数学与算法。让我们一起，从算法底层看懂AI，用数学逻辑支撑工程落地。
23210编辑于 2026-03-30
来自专栏生信菜鸟团
【生信文献200篇】08 scRNA-GBM-HNSCC-melanoma
of Expression Heterogeneity in Head and Neck Cancer 非恶性细胞的聚类没有个体差异如果只对已经被区分出来的三千多个非恶性肿瘤细胞进行聚类，采取SC3算法其2014的science关于GBM的单细胞转录组文章： DOI: 10.1126/science.1254257 标题是：《Single-cell RNA-seq highlights intratumoral heterogeneity in primary glioblastoma》而且当时把单细胞转录组的CNV算法在CCLE的数据里面验证了，如下图： ?
1.5K20发布于 2021-02-03
来自专栏机器学习AI算法工程
【R语言】用gbm包来提升决策树能力
自适应提升方法AdaBoost 它是一种传统而重要的Boost算法，在学习时为每一个样本赋上一个权重，初始时各样本权重一样。梯度提升方法Gradient Boosting 梯度提升算法初看起来不是很好理解，但我们和线性回归加以类比就容易了。回忆一下线性回归是希望找到一组参数使得残差最小化。在训练基学习器时可以使用再抽样方法，此时就称之为随机梯度提升算法stochastic gradient boosting 。 gbm(diabetes~. 提升算法继承了单一决策树的优点，例如：能处理缺失数据，对于噪声数据不敏感，但又摒弃了它的缺点，使之能拟合复杂的非线性关系，精确度大为提高。通过控制迭代次数能控制过度拟合，计算速度快。
4.3K41发布于 2018-03-13
来自专栏生信技能树
GEO数据挖掘-第一期-胶质母细胞瘤（GBM）
astrocytomas） · Grade I · Grade II：弥漫性星形细胞瘤 · Grade III：anaplastic astrocytoma · Grade IV：胶质母细胞瘤（glioblastoma，GBM 作者研究的是GBM样本和非肿瘤样本在lncRNA表达上的差异，所以先取出这180个样本中的77个GBM样本和23个非肿瘤样本 options( stringsAsFactors = F ) load( group_list )] o_expr = exprSet[ , grep( "oligodendroglioma", group_list )] } ## 样本分组，新的表达矩阵只有normal和gbm = cbind( n_expr, g_expr ) group_list = c(rep( 'normal', ncol( n_expr ) ), rep( 'gbm group_list ) ) rownames( design ) = colnames( exprSet ) } design contrast.matrix <- makeContrasts( "gbm-normal
2.4K60发布于 2018-10-25
来自专栏生信技能收藏
GEO数据挖掘-第一期-胶质母细胞瘤（GBM）
astrocytomas） · Grade I · Grade II：弥漫性星形细胞瘤 · Grade III：anaplastic astrocytoma · Grade IV：胶质母细胞瘤（glioblastoma，GBM 作者研究的是GBM样本和非肿瘤样本在lncRNA表达上的差异，所以先取出这180个样本中的77个GBM样本和23个非肿瘤样本 options( stringsAsFactors = F ) load( group_list )] o_expr = exprSet[ , grep( "oligodendroglioma", group_list )] } ## 样本分组，新的表达矩阵只有normal和gbm = cbind( n_expr, g_expr ) group_list = c(rep( 'normal', ncol( n_expr ) ), rep( 'gbm group_list ) ) rownames( design ) = colnames( exprSet ) } design contrast.matrix <- makeContrasts( "gbm-normal
1.7K01发布于 2019-08-31
来自专栏生信小驿站
R 梯度提升算法①
用gbm包实现随机梯度提升算法自适应提升方法AdaBoost 它是一种传统而重要的Boost算法，在学习时为每一个样本赋上一个权重，初始时各样本权重一样。梯度提升方法Gradient Boosting 梯度提升算法初看起来不是很好理解，但我们和线性回归加以类比就容易了。回忆一下线性回归是希望找到一组参数使得残差最小化。 gbm作者的经验法则是设置shrinkage参数在0.01-0.001之间，而n.trees参数在3000-10000之间。 setwd("E:\\Rwork") if(! suppressWarnings(require('gbm'))) { install.packages('gbm') require('gbm') } # 加载包和数据 library(gbm 函数建模 model <- gbm(diabetes~.
74030发布于 2018-08-27
来自专栏生信小驿站
R 集成算法④ 梯度提升树
介绍 Boosting是一类将弱学习器提升为强学习器的算法。 Boosting算法是在算法开始时，为每一个样本赋上一个相等的权重值，也就是说，最开始的时候，大家都是一样重要的。特点 GBM优点：可以和随机森林这样的高性能算法竞争能保持可靠的预测表现，预测结果比简单模型差的情况非常罕见常常被kaggle等竞赛的获胜者使用能处理缺失数据无需进行特征缩放能处理的因子水平比随机森林高 ", data = train_data, n.trees = 2000, shrinkage = 0.01) gbm1 prediction <- predict.gbm(gbm1 , test_data, type = "response", n.trees = 1000) summary.gbm(gbm1) ?
49120发布于 2018-08-27
来自专栏IT派
集成算法的简单分享
Gradient Boosting Machine（简称GBM）梯度提升算法，它通过求损失函数在梯度方向下降的方法，层层改进，sklearn中也实现了该算法：GradientBoostingClassifier GBM是目前非常流行的一类算法，在后面详细说明。３. Stacking Stacking训练一个模型用于组合(combine)其他各个基模型。 Sklearn中也实现了stacking模型：StackingClassifier 梯度提升算法（GB**） Gradient Boosting Machine（GBM）梯度提升算法是目前比较流行的数据挖掘模型 GBM常把决策树作为基模型，我们常看到的GBDT梯度提升决策树，一般也是指该算法。不过Sklearn是一个算法集，不是专门做GBM的。 ?
1.1K50发布于 2018-03-28
来自专栏Python与算法之美
刷分神器，使用hyperopt实现lightgbm自动化调参！
#随机搜索(hyperopt.rand.suggest) #模拟退火(hyperopt.anneal.suggest) #TPE算法（hyperopt.tpe.suggest，贝叶斯优化，算法全称为Tree-structured #随机搜索(hyperopt.rand.suggest) #模拟退火(hyperopt.anneal.suggest) #TPE算法（hyperopt.tpe.suggest，贝叶斯优化，算法全称为Tree-structured model_dir = "gbm.model" print("model_dir: %s"%model_dir) gbm.save_model("gbm.model",num_iteration=gbm.best_iteration #随机搜索(hyperopt.rand.suggest) #模拟退火(hyperopt.anneal.suggest) #TPE算法（hyperopt.tpe.suggest，算法全称为Tree-structured model_dir = "gbm.model" print("model_dir: %s"%model_dir) gbm.save_model("gbm.model",num_iteration=gbm.best_iteration
2.8K50发布于 2021-08-06
来自专栏生信技能树
TCGA中GBM的RNA-seq和甲基化数据整合分析实践
找出胶质细胞瘤特异性甲基化区域，为临床诊断提供理论依据步骤： 1、查找数据：下载TCGA中GBM的RNA-seq和甲基化数据 2、甲基化数据分析，正常肿瘤对比，进行差异甲基化分析，找出肿瘤样本中高甲基化区域 5、对找出的靶标进行验证，利用pubmed以及其他数据库，反向验证靶标的可靠性一、数据下载首先进入TCGA下载数据GBM的RNA-seq和甲基化数据，从下表可见GBM共有172套RNA-seq 图表 1TCGA数据汇总二、初步整理数据使用TCGA-Assembler.2.0.5进行GBM数据批量下载与初步整理，并且绘制RNA-seq 基因表达量盒型图以及甲基化芯片数据盒型图，由于数据量较大 family kinase 1，还是个激酶，激酶的话就对调控会有很大作用了，而在HPA RNA-seq normal tissues项目中，又看出来这个激酶在脑中表达量明显高于其他组织，这又与发生在脑部的GBM biological process生物学过程中的“神经系统发育”、“化学性突触传递”和“细胞膜的组织”等部分里面有着富集，特别是“中枢神经系统的髓鞘形成”，富集程度达到26.95倍，这又与研究的多发生于脑补的GBM
4.7K40发布于 2018-07-27
来自专栏作图丫
8+！胶质母细胞瘤中铁死亡相关模型构建~
首先，本研究通过 ESTIMATE 算法以提供 GBM 样本免疫景观的概述。然后，本研究对 GBM 样本进行 CIBERSORT 算法和 xCell 算法以鉴定免疫细胞浸润。 CIBERSORT 算法结果表明，TCGA 数据库中FeAS较低的 GBM 样本中 M2巨噬细胞较高，记忆CD4+ T细胞激活，NK细胞激活（图 5B）。 xCell 算法结果表明，高 FeAS 样品中 M1 巨噬细胞和未成熟树突细胞 (iDC) 的浸润率较高；TCGA 数据库中的低 FeAS 样本中富含自然杀伤细胞和 Th1 细胞（图 5C）。本研究通过针对高 FeAS 样本可以改善患者的预后，并且还通过执行机器学习算法预测了新的潜在化合物。总之，FeAS 模型可以评估胶质母细胞瘤的侵袭性，调节与免疫细胞的串扰并为化疗提供建议。
66120编辑于 2022-12-14
来自专栏机器之心
速度提升、准确率更胜一筹，周志华等人提出可微XGBoost算法sGBM
先从 GBM 讲起在详细介绍新提出的方法之前，先来看看梯度提升机（GBM）的工作方式。具体来说，对于给定的数据集 ? GBM 的训练过程是基于训练数据学习参数 ? 。GBM 首先假设 ? ，然后就能按顺序决定 ? 和 β_m。首先，给定 y^i 和 GBM 前一轮获得的预测结果， ? 算法 1 总结了这个训练过程，图 1 左图也给出了其示意图。 ? 算法 1：常规（硬）GBM 的训练过程 sGBM 有何不同？可以看出，GBM 的训练过程难以并行化，因为只有在一个基学习器拟合之后才能转向下一个基学习器。也因为这个原因，这类算法也难以在线应用。软梯度提升机（sGBM）就是针对这些问题而提出的。算法 2 阐释了这一过程。 ? 算法 2：训练 sGBM 软梯度提升决策树下面来看看适合 sGBM 的基学习器。研究者在论文中探讨了基学习器是决策树的具体情况。
94340发布于 2020-06-20
来自专栏杂七杂八
xgboost初识
并行处理 XGBoost可以实现并行处理，相比GBM有了速度的飞跃。不过，众所周知，Boosting算法是顺序处理的，它怎么可能并行呢？剪枝当分裂时遇到一个负损失时，GBM会停止分裂。因此GBM实际上是一个贪心算法。 XGBoost会一直分裂到指定的最大深度(max_depth)，然后回过头来剪枝。 sklearn中的GBM的实现也有这个功能，两种算法在这一点上是一致的。 XGBoost参数 XGBoost的作者把所有的参数分成了三类：通用参数：宏观函数控制。 subsample[默认1] 和GBM中的subsample参数一模一样。这个参数控制对于每棵树，随机采样的比例。减小这个参数的值，算法会更加保守，避免过拟合。可以应用在很高维度的情况下，使得算法的速度更快。 scale_pos_weight[默认1] 在各类别样本十分不平衡时，把这个参数设定为一个正值，可以使算法更快收敛。
1.3K40发布于 2018-04-27
来自专栏Python与算法之美
30分钟学会LightGBM
1，Histogram算法:直方图算法。 2，GOSS算法:基于梯度的单边采样算法。 3，EFB算法:互斥特征捆绑算法。三，Histogram算法直方图算法是替代XGBoost的预排序(pre-sorted)算法的。 y_pred_train = gbm.predict(dftrain.drop('label',axis = 1), num_iteration=gbm.best_iteration) y_pred_test = gbm.predict(dftest.drop('label',axis = 1), num_iteration=gbm.best_iteration) print('train accuracy model_dir = "data/gbm.model" print("model_dir: %s"%model_dir) gbm.save_model("data/gbm.model") printlog
1.6K51发布于 2020-07-20

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

gbm算法

探索Python中的基础算法：梯度提升机（GBM）

【原创精品】使用R语言gbm包实现梯度提升算法

R语言包_gbm

梯度提升（GBM）预测订单薄价格变动（代码+数据）

样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

强化学习算法解析：Gradient Boosting Machine（梯度提升机, GBM）算法原理、手动计算与PythonJava双代码实战指南

【生信文献200篇】08 scRNA-GBM-HNSCC-melanoma

【R语言】用gbm包来提升决策树能力

GEO数据挖掘-第一期-胶质母细胞瘤（GBM）

GEO数据挖掘-第一期-胶质母细胞瘤（GBM）

R 梯度提升算法①

R 集成算法④ 梯度提升树

集成算法的简单分享

刷分神器，使用hyperopt实现lightgbm自动化调参！

TCGA中GBM的RNA-seq和甲基化数据整合分析实践

8+！胶质母细胞瘤中铁死亡相关模型构建~

速度提升、准确率更胜一筹，周志华等人提出可微XGBoost算法sGBM

xgboost初识

30分钟学会LightGBM

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐