首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信小驿站

    factoextra包 聚类分析(2)

    聚类分析是一种数据贵呀技术,旨在揭露数据集中观测值的子集。它可以把大量的观测值归为若干个类。这里的类被定义为若干个观测值组成的群组,群组内观测值的相似度比群间的相似度高。这不是一个精确的定义,从而导致了各种聚类方法的出现。

    1.2K20发布于 2018-10-08
  • 来自专栏生信小驿站

    主成分分析 factoextra

    factoextra是一个R软件包,可以轻松提取和可视化探索性多变量数据分析的输出,其中包括: 主成分分析(PCA),用于通过在不丢失重要信息的情况下减少数据的维度来总结连续(即定量)多变量数据中包含的信息 为什么使用 R package factoextra具有灵活且易于使用的方法,可以用人类可读的标准数据格式快速提取上述不同软件包的分析结果。 factoextra R软件包可以处理来自多个软件包的PCA,CA,MCA,MFA,FAMD和HMFA的结果,用于提取和可视化数据中包含的最重要信息。 如果你想这样做,factoextra包提供了一个方便的解决方案。 如果您想使用PCA / MCA进行预测并使用ggplot2可视化补充变量/个体在因子图上的位置:那么factoextra可以为您提供帮助。

    2.1K30发布于 2018-08-27
  • 来自专栏用户7627119的专栏

    【R语言】factoextra生成发表级PCA主成分分析图(二)

    前面给大家简单介绍了做PCA分析并绘图的R包factoextra ☞【R语言】factoextra生成发表级PCA主成分分析图(一) 主要讲了如何展示样本的主成分分析结果,即样本在新的空间中的分布情况 今天我们来讲讲如何展示特征的分布,我们还是使用iris这套数据集 #加载这两个R包 library(FactoMineR) library(factoextra) #做PCA分析,第五列为物种,非数值属性需要去除 参考资料: ☞R做PCA主成分分析 ☞【R语言】factoextra生成发表级PCA主成分分析图(一)

    95910编辑于 2022-09-21
  • 来自专栏用户7627119的专栏

    【R语言】factoextra生成发表级PCA主成分分析图(三)

    前面我们们给大家简单介绍了 ☞【R语言】factoextra生成发表级PCA主成分分析图(一) ☞【R语言】factoextra生成发表级PCA主成分分析图(二) 今天我们来看看如何在主成分分析之后得到的新的空间中同时展示样本和特征 #首先我们需要安装下面这两个R包 install.packages("factoextra") install.packages("FactoMineR") #加载这两个R包 library(FactoMineR ) library(factoextra) #做PCA分析,第五列为物种,非数值属性需要去除 iris.pca <- PCA(iris[,-5], graph = T) 接下来我们就来同时展示样本和特征 参考资料: ☞【R语言】factoextra生成发表级PCA主成分分析图(一) ☞【R语言】factoextra生成发表级PCA主成分分析图(二)

    78520编辑于 2022-09-21
  • 来自专栏用户7627119的专栏

    【R语言】factoextra生成发表级PCA主成分分析图(一)

    前面给大家介绍过主成分分析 ☞R做PCA主成分分析 今天我们来给大家介绍另一个做PCA分析并绘图的R包factoextra,很多SCI文章中都用到了这个R包。 #首先我们需要安装下面这两个R包 install.packages("factoextra") install.packages("FactoMineR") #加载这两个R包 library(FactoMineR ) library(factoextra) 接下来我们查看一下要使用的数据,我们会用R里面自带的一套数据集iris。 addEllipses = TRUE, #添加边界线 ellipse.type = "convex" #设置边界线为多边形 ) 今天的分享就先到这里,后面我们会继续为大家介绍如何使用factoextra

    1.5K10编辑于 2022-09-21
  • 来自专栏生物信息学、python、R、linux

    R实现PCA降维

    package], dudi.pca() [ade4 package], and epPCA() [ExPosition package] install.packages(c("FactoMineR", "factoextra ")) library("FactoMineR") library("factoextra") #输入的data.frame data(decathlon2) head(decathlon2) ? image.png 我们可以通过这些函数提取需要的数据: get_eigenvalue(res.pca): 提取特征值 fviz_eig(res.pca): 可视化特征值 library("factoextra

    2K20发布于 2020-04-01
  • 来自专栏简说基因

    R语言中的主成分方法:PCA分析和可视化实用指南

    在本文中,我们将使用两个包FactoMineR(用于分析)和factoextra(用于基于ggplot2的可视化)。 ("factoextra") 数据格式 我们将使用factoextra包中的演示数据集 decathlon2 : data(decathlon2) # head(decathlon2) 如图3.1所示, 可视化和解释 我们将使用factoextra R包来帮助解释PCA。 可以使用函数 fviz_eig() 或 fviz_screeplot() [factoextra package]生成碎石图。 变量图 结果 从PCA输出中提取变量结果的一个简单方法是使用函数 get_pca_var() [factoextra package]。

    2.7K10编辑于 2025-03-13
  • 来自专栏小明的数据分析笔记本

    主成分分析、K均值聚类R语言实现小实例

    . = T) library(factoextra) fviz_eig(winepca,addlabels = T) fviz_pca_ind(winepca,col.ind = df$Customer_Segment --《Python机器学习基础教程》 library(factoextra) df<-read.csv("Wine.csv",header = T) winescale<-scale(df[,1:13

    1.7K30发布于 2020-03-03
  • 来自专栏小明的数据分析笔记本

    ggplot2画点和分组椭圆展示主成分分析(PCA)结果的简单小例子

    pca-principal-component-analysis-essentials/ 这个链接介绍的很详细了,大家可以自己去看一下 作主成分分析用到的是FactoMineR包中的PCA()函数 作图用到的是factoextra 包中的fviz_pca_ind()函数 这两个包如果是第一次使用需要先安装,运行如下命令 install.packages("FactoMineR") install.packages("factoextra ") 安装好以后运行如下命令加载 library(FactoMineR) library(factoextra) 示例数据直接用R语言的内置鸢尾花数据集 iris 第一步是主成分分析 iris.pca

    6.1K30发布于 2021-03-14
  • 来自专栏庄闪闪的R语言手册

    R可视乎|主成分分析结果可视化

    方法二 使用FactoMineR包[3]的PCA()函数或者使用基础包的prcomp()函数进行数据降维处理,然后使用factoextra包[4]的fviz_pca_ind()函数对结果进行可视化。 library(ggplot2) library(factoextra) #可以直接通过install.packages()进行下载 # 各个样本图 fviz_pca_ind(res.pca, col.ind github.com/vqv/ggbiplot [3] FactoMineR包: https://cran.r-project.org/web/packages/FactoMineR/index.html [4] factoextra 包: https://cran.r-project.org/web/packages/factoextra/index.html

    2.2K30发布于 2021-04-09
  • 来自专栏优雅R

    「Workshop」第十期:聚类

    计算距离矩阵 使用的数据集为USArrests: df <- USArrests df_scaled <- scale(df)##标准化 计算距离的R函数有很多,如: dist() get_dist() factoextra 2.703754 2.293520 # Alaska 2.703754 0.000000 2.700643 # Arizona 2.293520 2.700643 0.000000 library(factoextra manhattan stand: 逻辑值,输入的列是否要标准化 首先需要估计最佳聚类数,可以使用平均轮廓法(average silhouette method),平均轮廓值越高说明聚类质量越好 可以使用factoextra )) x: 数值矩阵或者数据框 FUNcluster: 聚类方法包括kmeans, pam, clara 和 hcut method: 决定最佳聚类数的方法 # Elbow method p1 <- factoextra NbClust(df_scaled, distance = "euclidean", min.nc = 2, max.nc = 10, method = "kmeans") factoextra

    3.2K20发布于 2020-07-29
  • 来自专栏生信技能树

    PCA-弱水三千,取哪一瓢饮?

    下面奉上我在对文章数据进行重现时,使用到的PCA代码: FactoMineR+factoextra 用到的参数的介绍 df[,-ncol(df)]这是对我用于主成分分析的数据的索引,去掉了最后一列的数据 ” 即表示除去某一列;这里的最后一列,是加进去的分组信息; PCA函数是FactoMineR包中的功能;graph参数设为FALSE后,这里只是保存了主成分分析后的结果; fviz_pca_ind是factoextra legend.title是fviz_pca_ind依赖的ggpubr::ggpar()包中的参数,为自己的legend取名,这里取名为'Groups'; library("FactoMineR") library("factoextra

    1.3K10发布于 2019-05-23
  • 来自专栏医学和生信笔记

    R语言聚类分析(1)

    确定最佳聚类个数过程也可以通过非常好用的R包factoextra实现。 library(factoextra) ## Loading required package: ggplot2 ## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa set.seed(123) fviz_nbclust(df, kmeans, k.max 不管是哪一种聚类方法,factoextra配合factomineR都可以给出非常好看的可视化结果。 结果可以画出来: clusplot(fit.pam, main = "PAM cluster") plot of chunk unnamed-chunk-20 同样也可以用factoextra包实现可视化

    80330编辑于 2022-11-15
  • 来自专栏小明的数据分析笔记本

    R语言做K均值聚类的一个简单小例子

    iris.kmeans结果里存储9个结果,可能会用到的是iris.kmeans$cluster存储的是每个样本被归为哪一类iris.kmeans$size存储的是每一个大类有多少个样本 使用散点图展示结果,借助factoextra 包中的fviz_cluster()函数 library(factoextra) fviz_cluster(object=iris.kmeans,data=iris[,1:4], https://www.datanovia.com/en/lessons/k-means-clustering-in-r-algorith-and-practical-examples/ 这个链接里提到factoextra

    2.6K20发布于 2020-09-29
  • 一. 生信入门环境搭建

    "impute"))# 但是接下来的代码又需要运行啦options()$reposinstall.packages('WGCNA')install.packages(c("FactoMineR", "factoextra "))install.packages(c("ggplot2", "pheatmap","ggpubr"))library("FactoMineR")library("factoextra")library

    35900编辑于 2024-03-15
  • 来自专栏火星娃统计

    GEO数据挖掘3

    BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor") # install.packages(c("FactoMineR", "factoextra ")) library("FactoMineR") library("factoextra") # 数据处理,去掉分组信息 dat.pca <- PCA(dat[,-ncol(dat)], graph

    1.2K31发布于 2020-09-15
  • 来自专栏生信技能树

    PCA-Statistics is the new sexy!!!

    这里把PCA的过程用我理解的基础函数,做了包装,大家试着理解一下吧: rm(list=ls()) ######数据集可用于测试PCA library("FactoMineR") library("factoextra 对比下在R的现成的PCA功能的结果 FactoMineR和factoextra配合做PCA和可视化(下图中图片名为PCA); prcomp(stats base级别)和autoplot配合做PCA和可视化 (下图中图片名为prcomp); ######以下是FactoMineR和factoextra的工作: res<-PCA(X = decathlon2.active, scale.unit = FALSE

    96420发布于 2019-05-24
  • 来自专栏R语言数据分析指南

    ISME图表复现之PCA分析图添加统计信息

    springs 原图 复现图 加载R包 library(tidyverse) library(ggrepel) library(FactoMineR) library(magrittr) library(factoextra

    25820编辑于 2023-08-18
  • 来自专栏生信小驿站

    无监督学习 聚类分析③

    值肯定是随着聚类数目增多而减少的,所以关注的是斜率的变化,但WWS减少得很缓慢时,就认为进一步增大聚类数效果也并不能增强,存在得这个“肘点”就是最佳聚类数目,从一类到三类下降得很快,之后下降得很慢,所以最佳聚类个数选为三 factoextra 包 library(factoextra) library(ggplot2) set.seed(1234) fviz_nbclust(dataset, kmeans, method = "wss")

    84640发布于 2018-08-27
  • 来自专栏生信菜鸟团

    探索TCGA的临床特征分组——做差异分析前你有没有忘记它

    prior_malignancy.diagnoses) # no yes #138 13 gp = n2$prior_malignancy.diagnoses library("FactoMineR") library("factoextra fish_evaluation_performed_ind) # NO YES # 3 26 122 gp = n2$fish_evaluation_performed_ind library("FactoMineR") library("factoextra #第11列是na groupl = colnames(n2) dat.pca <- PCA(dat , graph = FALSE) library("FactoMineR") library("factoextra

    2K10编辑于 2022-10-31
领券