首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信小驿站

    gbm算法

    GBDT(Gradient Boosting Decision Tree)又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成 gbm扩展了Freund and Schapire的Adaboost算法和Friedman的梯度提升机(gradient boosting machine)。 [图片上传失败... (image-32b7ea-1540222324149)] gbm包 实际上,梯度提升算法并不特指某个特定模型,而是一种机器学习思想,被人们运用到许多传统的模型中而形成了一类强大的机器学习方法。 有趣的是,gbm包的全称也并不是Gradient Boost Machine,而是generalized boosted regression models—广义提升回归模型,即运用了boosting算法的广义回归模型 GBM有以下特点: 可以和随机森林这样的高性能算法竞争。 能保持可靠的预测表现,并且能避免无意义的预测。 能明确地处理缺失数据。 无需进行特征缩放。 能处理的因子水平比随机森林更高。

    5.8K00发布于 2018-11-12
  • 来自专栏数据结构和算法

    探索Python中的基础算法:梯度提升机(GBM

    在机器学习领域中,梯度提升机(Gradient Boosting Machine,GBM)是一种强大的集成学习算法,常用于解决回归和分类问题。 本文将详细介绍GBM的原理、实现步骤以及如何使用Python进行编程实践。 什么是梯度提升机? 梯度提升机是一种集成学习方法,它通过将多个弱学习器组合起来构建一个强大的模型。 在GBM中,每个弱学习器都是基于决策树的,它们是通过梯度下降的方法来逐步构建的。 总结 梯度提升机是一种强大的集成学习算法,它在许多实际问题中都表现出色。通过本文的介绍,你已经了解了梯度提升机的原理、实现步骤以及如何使用Python进行编程实践。 希望本文能够帮助你更好地理解和应用梯度提升机算法

    1K11编辑于 2024-03-21
  • 来自专栏量化投资与机器学习

    【原创精品】使用R语言gbm包实现梯度提升算法

    ● 朴素贝叶斯算法在Python和R的应用 所有编辑部原创文章,未经授权 任何个人和机构不得以任何方式转载 gbm-Gradient Boost Machinet 梯度提升算法 梯度提升算法Gradient 找到最佳步长ρt使得 gbm包 实际上,梯度提升算法并不特指某个特定模型,而是一种机器学习思想,被人们运用到许多传统的模型中而形成了一类强大的机器学习方法。 有趣的是,gbm包的全称也并不是Gradient Boost Machine,而是generalized boosted regression models—广义提升回归模型,即运用了boosting算法的广义回归模型 gbm包中最主要的函数为gbm/gbm.fit。函数提供了很多参数以进行模型调优。 (1)distribution:模型计算损失函数时,需要对输出变量的数据分布做出假设。 迭代次数的选择与学习速率密切相关,下图展示了模型表现、学习速率和迭代次数之间的关系: 迭代次数可以设得稍微大一点,因为模型训练完后,gbm中的gbm.perf可以估计出最佳迭代次数以供预测阶段使用。

    5.6K71发布于 2018-01-29
  • 来自专栏YoungGy

    R语言包_gbm

    gbm效果和randomForest相近,但是占用内存更少,且支持多核crossValidation运算。 names(getModelInfo()) titanicDF$Survived <- ifelse(titanicDF$Survived==1,'yes','nope') # pick model gbm and find out what type of model it is getModelInfo()$gbm$type # split data into training and testing ######################## # glm model ################################################ # pick model gbm ########## # advanced stuff ################################################ # boosted tree model (gbm

    1.9K20发布于 2019-05-26
  • 来自专栏Hank’s Blog

    4-6 R语言函数 排序

    #sort:对向量进行排序;返回排好序的内容 #order:返回排好序的内容的下标/多个排序标准 > x <- data.frame(v1=1:5,v2=c(10,7,9,6,8),v3=11:15,v4=c(1,1,2,2,1)) > sort(x$v2) [1] 6 7 8 9 10 > sort(x$v2,decreasing = TRUE) [1] 10 9 8 7 6 > order(x$v2) [1] 4 2 5 3 1 > x[order(x$v2),] v1 v

    36740发布于 2020-09-16
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 4-6 网格搜索与k近邻算法中更多超参数

    本系列是《玩转机器学习教程》一个整理的视频笔记。本小节主要介绍使用sklearn网格搜索寻找最好的超参数以及kNN计算两个数据点距离的其他距离定义。

    78000发布于 2019-11-13
  • 来自专栏量化投资与机器学习

    梯度提升(GBM)预测订单薄价格变动(代码+数据)

    通过梯度提升和微调(Fine-Tuning)建模 我们的目标是证明训练一个GBM是对真实目标y和近似值之间的某个损失函数进行梯度下降最小化: ? 这意味着添加弱模型: ? 对于我们的GBM加性模型: ? 在某种程度上是梯度下降。让近似值越来越接近真实y是有意义的,这就是梯度下降。例如,每一步的残差都变小。我们必须最小化与真实目标和近似距离相关的函数。 这个算法有几个参数对质量有很大的影响: n_estimators:在解决机器学习问题时可以构建树的最大数量。 depth:树的最大深度。 learning_rate:用于减少梯度步骤。

    2.6K32发布于 2019-07-10
  • 来自专栏拓端tecdat

    样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化

    p=22336 Boosting算法是一种把若干个分类器整合为一个分类器的方法,也就是一种集成分类方法(Ensemble Method)。 因此,让我们尝试一些稍微不同的方法,来介绍adaboost算法,AdaBoost是最著名的Boosting族算法。 在我们最初的讨论中,目标是最小化一个凸的损失函数。 我们在这里所做的与梯度下降(或牛顿算法)有关。之前,我们是从误差中学习的。在每个迭代中,计算残差,并对这些残差拟合一个(弱)模型。这个弱模型的贡献被用于梯度下降优化过程。 R函数:梯度提升(_GBM_)算法 也可以使用R函数。 gbm(y~ . 图6 ---- 本文摘选《R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化》

    82960编辑于 2022-03-05
  • 来自专栏常用算法专栏

    强化学习算法解析:Gradient Boosting Machine(梯度提升机, GBM算法原理、手动计算与PythonJava双代码实战指南

    关键词:机器学习、梯度提升机、GBM算法、GBDT、负梯度拟合、残差学习、PythonGBM、JavaWekaGradientBoosting、XGBoost基础、Boosting。 尽管已有更高效的变体,但理解原始GBM,是掌握所有梯度提升算法的必经之路。记住:最好的模型,不是一次建成的,而是一步步优化出来的。 现在,你已经能:手动执行GBM多轮残差拟合理解负梯度如何指导新树训练在Python/Java中实现并调优GBM区分GBM与AdaBoost、随机森林的本质差异常用算法专栏:欢迎到访「算法与数学底层系列」 在AI大模型飞速发展的今天,一切智能的本质,最终都落脚于数学与算法。 让我们一起,从算法底层看懂AI,用数学逻辑支撑工程落地。

    23910编辑于 2026-03-30
  • 来自专栏yuyy.info技术专栏

    《代码整洁之道》笔记(4-6章节)

    个人认为注释还是要写,算是对代码的中文翻译,因为我们的英语水平,命名习惯各不相同。

    28010编辑于 2022-06-28
  • 来自专栏AI科技大本营的专栏

    XGBoost参数调优完全指南(附Python代码)

    它会帮助你对Boosting算法有一个宏观的理解,同时也会对GBM的参数调整有更好的体会。 1.2 并行处理 XGBoost可以实现并行处理,相比GBM有了速度的飞跃。 不过,众所周知,Boosting算法是顺序处理的,它怎么可能并行呢? 1.5 剪枝 当分裂时遇到一个负损失时,GBM会停止分裂。因此GBM实际上是一个贪心算法。 XGBoost会一直分裂到指定的最大深度(max_depth),然后回过头来剪枝。 sklearn中的GBM的实现也有这个功能,两种算法在这一点上是一致的。 相信你已经对XGBoost强大的功能有了点概念。 起始值在4-6之间都是不错的选择。 min_child_weight = 1:在这里选了一个比较小的值,因为这是一个极不平衡的分类问题。因此,某些叶子节点下的值会比较小。

    9K92发布于 2018-04-27
  • 来自专栏机器学习AI算法工程

    【R语言】用gbm包来提升决策树能力

    自适应提升方法AdaBoost 它是一种传统而重要的Boost算法,在学习时为每一个样本赋上一个权重,初始时各样本权重一样。 梯度提升方法Gradient Boosting 梯度提升算法初看起来不是很好理解,但我们和线性回归加以类比就容易了。回忆一下线性回归是希望找到一组参数使得残差最小化。 在训练基学习器时可以使用再抽样方法,此时就称之为 随机梯度提升算法stochastic gradient boosting 。 gbm(diabetes~. 提升算法继承了单一决策树的优点,例如:能处理缺失数据,对于噪声数据不敏感,但又摒弃了它的缺点,使之能拟合复杂的非线性关系,精确度大为提高。通过控制迭代次数能控制过度拟合,计算速度快。

    4.3K41发布于 2018-03-13
  • 来自专栏生信菜鸟团

    【生信文献200篇】08 scRNA-GBM-HNSCC-melanoma

    of Expression Heterogeneity in Head and Neck Cancer 非恶性细胞的聚类没有个体差异 如果只对已经被区分出来的三千多个非恶性肿瘤细胞进行聚类,采取SC3算法 其2014的science关于GBM的单细胞转录组文章: DOI: 10.1126/science.1254257 标题是:《Single-cell RNA-seq highlights intratumoral heterogeneity in primary glioblastoma》 而且当时把单细胞转录组的CNV算法在CCLE的数据里面验证了,如下图: ?

    1.5K20发布于 2021-02-03
  • 来自专栏生信技能树

    GEO数据挖掘-第一期-胶质母细胞瘤(GBM

    astrocytomas) · Grade I · Grade II:弥漫性星形细胞瘤 · Grade III:anaplastic astrocytoma · Grade IV:胶质母细胞瘤(glioblastoma,GBM 作者研究的是GBM样本和非肿瘤样本在lncRNA表达上的差异,所以先取出这180个样本中的77个GBM样本和23个非肿瘤样本 options( stringsAsFactors = F ) load( group_list )] o_expr = exprSet[ , grep( "oligodendroglioma", group_list )] } ## 样本分组,新的表达矩阵只有normal和gbm = cbind( n_expr, g_expr ) group_list = c(rep( 'normal', ncol( n_expr ) ), rep( 'gbm group_list ) ) rownames( design ) = colnames( exprSet ) } design contrast.matrix <- makeContrasts( "gbm-normal

    2.4K60发布于 2018-10-25
  • 来自专栏生信技能收藏

    GEO数据挖掘-第一期-胶质母细胞瘤(GBM

    astrocytomas) · Grade I · Grade II:弥漫性星形细胞瘤 · Grade III:anaplastic astrocytoma · Grade IV:胶质母细胞瘤(glioblastoma,GBM 作者研究的是GBM样本和非肿瘤样本在lncRNA表达上的差异,所以先取出这180个样本中的77个GBM样本和23个非肿瘤样本 options( stringsAsFactors = F ) load( group_list )] o_expr = exprSet[ , grep( "oligodendroglioma", group_list )] } ## 样本分组,新的表达矩阵只有normal和gbm = cbind( n_expr, g_expr ) group_list = c(rep( 'normal', ncol( n_expr ) ), rep( 'gbm group_list ) ) rownames( design ) = colnames( exprSet ) } design contrast.matrix <- makeContrasts( "gbm-normal

    1.7K01发布于 2019-08-31
  • 来自专栏一心无二用,本人只专注于基础图像算法的实现与优化。

    SSE图像算法优化系列四:图像转置的SSE优化(支持8位、24位、32位),提速4-6

    一、前言       转置操作在很多算法上都有着广泛的应用,在数学上矩阵转置更有着特殊的意义。 而在图像处理上,如果说图像数据本身的转置,除了显示外,本身并无特殊含义,但是在某些情况下,确能有效的提高算法效率,比如很多行列可分离的算法,在很多情况下,行和列方向的算法逻辑随相同,但是由于多方面原因( 比如Cache miss, 优化水平等)行列处理时间还是由很大的差异的,这个时候如果转置的耗时和处理时间相比所占比例甚小,则可以考虑在进行耗时处理前先转置数据,然后调用不耗时的方向的算法,处理完后再次进行转置 因此,一个高效的图像转置算法的设计时非常有必要的。 (也就是每个通道都用相同的算法处理,并且算法和领域无关)外,都很难直接用SIMD处理,很多情况下必须做一些转换处理来提高适配性。      

    2.4K100发布于 2018-01-03
  • 来自专栏量子位

    支持移动GPU、推断速度提升4-6

    TensorFlow用于移动设备的框架TensorFlow Lite发布重大更新,支持开发者使用手机等移动设备的GPU来提高模型推断速度。

    1.1K30发布于 2019-04-24
  • 来自专栏生信小驿站

    R 梯度提升算法

    gbm包实现随机梯度提升算法 自适应提升方法AdaBoost 它是一种传统而重要的Boost算法,在学习时为每一个样本赋上一个权重,初始时各样本权重一样。 梯度提升方法Gradient Boosting 梯度提升算法初看起来不是很好理解,但我们和线性回归加以类比就容易了。回忆一下线性回归是希望找到一组参数使得残差最小化。 gbm作者的经验法则是设置shrinkage参数在0.01-0.001之间,而n.trees参数在3000-10000之间。 setwd("E:\\Rwork") if(! suppressWarnings(require('gbm'))) { install.packages('gbm') require('gbm') } # 加载包和数据 library(gbm 函数建模 model <- gbm(diabetes~.

    74030发布于 2018-08-27
  • 来自专栏人人都是极客

    支持移动GPU、推断速度提升4-6

    虽然移动设备的处理能力和功率都有限。虽然TensorFlow Lite提供了不少的加速途径,比如将机器学习模型转换成定点模型,但总是会在模型的性能或精度上做出让步。

    1.6K20发布于 2019-03-15
  • 来自专栏生信小驿站

    R 集成算法④ 梯度提升树

    介绍 Boosting是一类将弱学习器提升为强学习器的算法。 Boosting算法是在算法开始时,为每一个样本赋上一个相等的权重值,也就是说,最开始的时候,大家都是一样重要的。 特点 GBM优点: 可以和随机森林这样的高性能算法竞争 能保持可靠的预测表现,预测结果比简单模型差的情况非常罕见 常常被kaggle等竞赛的获胜者使用 能处理缺失数据 无需进行特征缩放 能处理的因子水平比随机森林高 ", data = train_data, n.trees = 2000, shrinkage = 0.01) gbm1 prediction <- predict.gbm(gbm1 , test_data, type = "response", n.trees = 1000) summary.gbm(gbm1) ?

    49320发布于 2018-08-27
领券