首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习专栏

    机器学习:基于层次的聚类算法

    基于层次的聚类算法(Hierarchical Clustering)可以是凝聚的(Agglomerative)或者分裂的(Divisive),取决于层次的划分是“自底向上”还是“自顶向下”。 自底向上算法 Agglomerative Clustering算法 相比于Hierarchical K-means算法存在的问题,Agglomerative Clustering算法能够保证距离近的对象能够被聚类到一个簇中 另外,Agglomerative性能较低,并且因为聚类层次信息需要存储在内存中,内存消耗大,不适用于大量级的数据聚类,下面介绍一种针对大数据量级的聚类算法BIRCH。 BIRCH算法相比Agglomerative凝聚算法具有如下特点: 解决了Agglomerative算法不能撤销先前步骤的工作的缺陷; CF-树只存储原始数据的特征信息,并不需要存储原始数据信息,内存开销上更优 ; BIRCH算法只需要遍历一遍原始数据,而Agglomerative算法在每次迭代都需要遍历一遍数据,所以BIRCH在性能也优于Agglomerative; 支持对流数据的聚类,BIRCH一开始并不需要所有的数据

    11.4K11发布于 2017-06-05
  • 来自专栏JetpropelledSnake

    机器学习笔记之聚类算法 层次聚类 Hierarchical Clustering

    0x03 自底向上的层次聚类算法(Agglomerative) 层次聚类的合并算法通过计算两类数据点间的相似性,对所有数据点中最为相似的两个数据点进行组合,并反复迭代这一过程。 相比于Hierarchical K-means算法存在的问题,Agglomerative Clustering算法能够保证距离近的对象能够被聚类到一个簇中,该算法采用的“自底向上”聚类的思路。 3.1 Agglomerative算法示例 对于如下数据: ? 另外,Agglomerative性能较低,并且因为聚类层次信息需要存储在内存中,内存消耗大,不适用于大量级的数据聚类。 3.4 常用Agglomerative算法 ? ?

    28.1K43发布于 2021-03-12
  • 来自专栏C++

    【机器学习】无监督学习携凝聚型层次聚类登场。无需预设标签,仅凭数据内在特质,逐步归拢聚合,挖掘隐藏群组,为复杂数据剖析开启智能、高效的新思路。

    层次聚类有两种主要类型:凝聚型层次聚类(Agglomerative Clustering)和分裂型层次聚类(Divisive Clustering)。 层次聚类分为两种主要形式: 凝聚型层次聚类(Agglomerative Clustering):从每个数据点视为一个独立簇开始,通过逐步合并最相似的簇,直到最终所有数据点合并为一个簇。 以下是一个完整的 凝聚型层次聚类(Agglomerative Hierarchical Clustering) 的 Python 实现。 凝聚型层次聚类算法 def agglomerative_clustering(X, n_clusters=2): """ 凝聚型层次聚类实现 :param X: 数据集 (n_samples 可视化 # 可视化结果 plt.scatter(X[:, 0], X[:, 1], c=labels, cmap='viridis', s=50) plt.title(f'Agglomerative Hierarchical

    61110编辑于 2025-01-20
  • 来自专栏机器学习原理

    机器学习(8)——其他聚类层次聚类画出原始数据的图小结

    凝聚的层次聚类 AGNES算法( Agglomerative Nesting)采用自底向上的策略。 另外,Agglomerative性能较低,并且因为聚类层次信息需要存储在内存中,内存消耗大,不适用于大量级的数据聚类,下面介绍一种针对大数据量级的聚类算法BIRCH。 image.png BIRCH算法相比Agglomerative凝聚算法具有如下特点: (1)解决了Agglomerative算法不能撤销先前步骤的工作的缺陷; (2)CF-树只存储原始数据的特征信息, 并不需要存储原始数据信息,内存开销上更优; (3)BIRCH算法只需要遍历一遍原始数据,而Agglomerative算法在每次迭代都需要遍历一遍数据,所以BIRCH在性能也优于Agglomerative ; (4)支持对流数据的聚类,BIRCH一开始并不需要所有的数据; 小结 本章主要介绍了聚类中的其他聚类算法的思想—层次聚类,着重介绍了算法—Agglomerative算法,BIRCH算法。

    2.1K60发布于 2018-04-27
  • 来自专栏杨丝儿的小站

    【机器学习】第四部分:聚类问题

    凝聚层次聚类 ① 定义 凝聚层次(Agglomerative)算法,首先将每个样本看做独立的聚类,如果聚类数大于预期,则合并两个距离最近的样本作为一个新的聚类,如此反复迭代,不断扩大聚类规模的同时,减少聚类的总数 依据对距离的不同定义,将Agglomerative Clustering的聚类方法分为三种: ward:默认选项,挑选两个簇来合并,是的所有簇中的方差增加最小。这通常会得到大小差不多相等的簇。 n_clusters=4) # n_cluster为聚类数量 model.fit(x) # 训练 pred_y = model.labels_ # 聚类标签(聚类结果) # 可视化 mp.figure("Agglomerative ", facecolor="lightgray") mp.title("Agglomerative") mp.xlabel("x", fontsize=14) mp.ylabel("y", fontsize

    1.8K20编辑于 2022-02-18
  • 来自专栏hsdoifh biuwedsy

    Hierarchical clustering and dimension reduction

    Lecture 8: Hierarchical clustering and dimension reduction -be able to explain the steps of (agglomerative hierarchical clustering, using single linkage (min) Two main types of hierarchical clustering Agglomerative

    63120发布于 2021-05-19
  • 来自专栏啄木鸟软件测试

    快速入门Python机器学习(28)

    1.4 凝聚聚类(agglomerative) 1.4.1原理 凝聚聚类(agglomerative clustering)指的是许多基于相同原则构建的聚类算法,这一原则是:算法首先声明每个点是自己的簇 1.4.3对make_blobs数据进行凝聚聚类算法分析 #凝聚算法 from scipy.cluster.hierarchy import dendrogram,ward def agglomerative_algorithm (): mglearn.plots.plot_agglomerative_algorithm() plt.show() blobs = make_blobs(random_state

    49610编辑于 2022-09-23
  • 来自专栏生信小驿站

    factoextra包 聚类分析(2)

    最常用的两种聚类方法是层次聚类(hierarchical agglomerative clustering)和划分聚类(partitioning clustering)。

    1.2K20发布于 2018-10-08
  • 来自专栏Pseudoyu

    COMP7103 Topic 3 Clustering

    ., animal kingdom, phylogeny reconstruction, …) Two main types of hierarchical clustering Agglomerative Traditional hierarchical algorithms use a similarity or distance matrix Merge or split one cluster at a time Agglomerative

    51020编辑于 2023-04-11
  • 来自专栏图灵技术域

    基于训练集动态代理模型的PSO特征选择算法

    Agglomerative Clustering 目的:解决DROP3算法的问题来构造代理模型(摒弃了KNN算法) ?

    1K10发布于 2021-05-21
  • 来自专栏微生态与微进化

    层次聚类与聚类树

    ⑴单连接聚合聚类 单连接聚合聚类(singlelinkage agglomerative clustering)也称作最近邻分类(nearestneighbour sorting),依据最短的成对距离或最大相似性来依次连接对象直到连接完毕 ⑵完全连接聚合聚类 完全连接聚合聚类(completelinkage agglomerative clustering)也称作最远邻分类(furthestneighbour sorting),依据最远距离决定一个对象或者一个组是否与另一个组聚合

    2.2K30编辑于 2022-05-05
  • 来自专栏数据派THU

    8个常见的无监督聚类方法介绍和比较

    本文将分为2个部分,1、常见算法比较 2、聚类技术的各种评估方法 本文作为第一部分将介绍和比较各种聚类算法: K-Means Affinity Propagation Agglomerative Clustering cluster_center[1], x[1]], col) plt.title("Estimated number of clusters: %d" % n_clusters_) plt.show() 3、Agglomerative Clustering 凝聚层次聚类(Agglomerative  Clustering)是一种自底向上的聚类算法,它将每个数据点视为一个初始簇,并将它们逐步合并成更大的簇,直到达到停止条件为止。 Agglomerative  Clustering算法的优点是适用于不同形状和大小的簇,且不需要事先指定聚类数目。此外,该算法也可以输出聚类层次结构,便于分析和可视化。

    85130编辑于 2023-04-03
  • 来自专栏AILearning

    【Scikit-Learn 中文文档】聚类 - 无监督学习 - 用户指南 | ApacheCN

    FeatureAgglomeration The FeatureAgglomeration 使用 agglomerative clustering 将看上去相似的 特征组合在一起,从而减少特征的数量 Agglomerative cluster 存在 “rich get richer” 现象导致聚类大小不均匀。这方面 complete linkage 是最坏的策略,Ward 给出了最规则的大小。 Agglomerative clustering with and without structure Warning Connectivity constraints with average 在少量聚类的限制中, 更倾向于给出一些 macroscopically occupied clusters 并且几乎是空的 (讨论内容请查看 Agglomerative clustering with 示例: Agglomerative clustering with different metrics 2.3.7.

    5.8K110发布于 2018-01-15
  • 来自专栏【计网】Cisco

    【Python】机器学习之聚类算法

    其中,凝聚聚类算法(Agglomerative Clustering)是我自学的一种聚类方法。 1.K-means K-means将数据分成K个簇,每个簇都以一个质心代表。 viridis" plt.xlabel("sepal length (cm)") # 设置x轴标签 plt.ylabel("sepal width (cm)") # 设置y轴标签 plt.title("Agglomerative Clustering") # 设置图的标题为"Agglomerative Clustering" plt.savefig("data/Agglomerative聚类结果.png") # 保存图像为文件 使用 plt.title() 设置图的标题为 "Agglomerative Clustering"。 使用 plt.savefig() 将绘制的聚类结果图保存为文件。 文件名为 "Agglomerative聚类结果.png",保存在名为 "data" 的文件夹中。 最后,使用 plt.show() 显示绘制的图像。这将在图形窗口中显示聚类结果图。

    84510编辑于 2024-02-20
  • 来自专栏算法进阶

    4种聚类算法及可视化(Python)

    方法2:聚和聚类法Agglomerative Clustering 聚合聚类是一种分层聚类算法,它迭代地合并类似的聚类以形成更大的聚类。 尝试了K-means聚类、Agglomerative聚类、Affinity Propagation聚类和DBSCAN聚类方法,每种方法都有自己的优点和缺点。

    1.5K20编辑于 2023-08-28
  • 来自专栏小馒头学Python

    【机器学习】聚类算法分类与探讨

    AGNES(自底向上聚类)算法概述:AGNES(Agglomerative Nesting)是一种层次聚类算法,通过自底向上合并每个样本或簇,构建树状的层次结构。它不需要提前设定簇的数量。 Silhouette Score: {kmeans_score:.4f}")print(f"DBSCAN Silhouette Score: {dbscan_score:.4f}")print(f"Agglomerative

    57810编辑于 2024-11-14
  • 来自专栏生信修炼手册

    层次聚类Hierarchical Clustering解析

    自下而上,由叶子节点开始,将相似样本划分为不同的子cluster,然后对cluster也按照相似度组成更大的cluster, 直到根节点为止,该方法也叫做凝聚法Agglomerative 2.

    1.9K20发布于 2021-03-24
  • 来自专栏数据STUDIO

    基于相关性的四种机器学习聚类方法

    方法2:聚和聚类法Agglomerative Clustering 聚合聚类是一种分层聚类算法,它迭代地合并类似的聚类以形成更大的聚类。 尝试了K-means聚类、Agglomerative聚类、Affinity Propagation聚类和DBSCAN聚类方法,每种方法都有自己的优点和缺点。

    94120编辑于 2023-09-04
  • 来自专栏人工智能前沿讲习

    【他山之石】基于相关性的四种机器学习聚类方法

    方法2:聚和聚类法Agglomerative Clustering 聚合聚类是一种分层聚类算法,它迭代地合并类似的聚类以形成更大的聚类。 尝试了K-means聚类、Agglomerative聚类、Affinity Propagation聚类和DBSCAN聚类方法,每种方法都有自己的优点和缺点。

    36120编辑于 2023-08-29
  • 来自专栏数据科学(冷冻工厂)

    层次聚类算法

    层次聚类可以分为两种方法:自下而上的聚合法(agglomerative)和自上而下的分裂法(divisive)。

    1.8K10编辑于 2023-03-21
领券