首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏微生态与微进化

    RDA-PLS:多数据集关联分析

    冗余分析 现有三组处理的小鼠分别为正常食物饮食(NCD)、高脂肪酸饮食(HFD)、牛磺熊去氧胆酸(TUDCA),我们以这个因子变量对其肠道微生物群落进行约束排序也即RDA分析,筛选受不同处理影响较大的物种 分析筛选受不同处理影响大的关键物种(keyotu),具体方法如下: #RDA分析 library("maptools") rda=rda(speci~Diet_, data=tret, scale=FALSE 接下来提取RDA分析结果,并筛选主坐标RDA1和RDA2解释量最大的100个otu,也即根据主坐标得分以及其解释量筛选物种: #提取RDA分析结果并筛选主坐标得分高的OTU rda_sum=summary (rda, scaling=2) #scaling=2表示保留两个主约束坐标 sp=as.matrix(rda_sum$species[,1:2]) si=as.matrix(rda_sum$sites [,1:2]) cn=as.matrix(rda_sum$centroids[,1:2]) rdap=as.vector(rda_sum$cont$importance[2,1:2], mode="any

    1.2K20编辑于 2022-05-05
  • 来自专栏用户7627119的专栏

    R的save,load函数和 .rda文件

    接下来我们通过save()保存一下这三个数值向量到一个本地文件中 save(count, age, circumference, file = "mydata.rda") 这个时候你会在你的当前工作路径中发现多了一个新的文件 ,叫mydata.rda。 最后我们再通过load()函数来加载我们保存的文件来恢复这三个变量 load(file = "mydata.rda") 你会发现这三个变量又重新出现在了变量区 ? 你还可以轻松的将这个mydata.rda文件分享给你的同事或者朋友,这样他们也能通过load来加载这个文件,从而获取这三个变量的值,继续做后续的分析。

    11.4K41发布于 2020-09-30
  • 来自专栏小明的数据分析笔记本

    R语言做冗余分析(RDA)的一个简单小例子

    最近自己在看一些群体遗传相关的内容,发现RDA也可以用在群体遗传方面 ,比如这个参考链接 https://popgen.nescent.org/2018-03-27_RDA_GEA.html 就介绍了这个分析 分析了 library(vegan) RDA <- rda(geno ~ env$envir1 + env$envir2 + env$envir3 + env$envir4 + env$envir5 + $CCA$v[,1], y=RDA$CCA$v[,2]), col = "gray86") + geom_point(aes(x=RDA$CCA$v[which(res_rdadapt[,2] < 0.1),1], y=RDA$CCA$v[which(res_rdadapt[,2] < 0.1),2]), col = "orange") + geom_segment(aes(xend=RDA$ =arrow(length = unit(0.02, "npc"))) + geom_text(aes(x=1.2*RDA$CCA$biplot[,1]/10, y=1.2*RDA$CCA$biplot

    4.8K61发布于 2021-03-15
  • 来自专栏小麦苗的DB宝专栏

    【DB笔试面试695】在Oracle中,什么是Oracle RDA(Remote Diagnostic Agent)工具?

    ♣ 答案部分 RDA(Remote Diagnostic Agent)是用Perl语言编写的命令行诊断工具,RDA提供统一的诊断工具支持包和预防的解决方法,提供给Oracle支持收集的客户环境全面的数据信息能够帮助问题的诊断 Oracle支持鼓励使用RDA,因为它能对于更多信息最小化请求数量而大大减少服务请求解决的时间。RDA不会对系统做任何的修改,它只为Oracle支持收集有用的数据,如果需要可以提供经安全过滤的数据。 RDA安装包大约15M左右,相比其它工具而言,稍大一些。 MOS文档“Remote Diagnostic Agent (RDA) - RDA文档索引 (文档 ID 1540377.1)”和“Remote Diagnostic Agent (RDA) - Getting Started (文档 ID 314422.1)”对Oracle RDA有详细的说明。

    63210发布于 2019-11-28
  • 来自专栏Listenlii的生物信息笔记

    R-三种做PCA函数的差异:princomp,prcomp及rda

    Rda是vegan包的一个函数,我自己一直用的是rda这个函数来做PCA。虽然简单,但是功能强大。只输入OTU表时做PCA,如果再加上环境因子就做RDA。函数的说明文档中没有专门提做PCA时的方法。 但是做RDA采用的是奇异值分解。 ? 对一批数据进行了测试,发现三种方法解释度基本一样,princomp和prcomp的标准偏差也很相似。 13.79054 12.46892 Proportion of Variance 0.00626 0.00512 Cumulative Proportion 0.96378 0.96890 #rda >x.pca = rda(x)>summary(x.pca) #注意,这里如果先将OTU表转置一下再做princomp就会报错: > x.princomp=princomp(t(x),cor = TRUE

    9K62发布于 2020-05-29
  • 来自专栏Listenlii的生物信息笔记

    rdaenvpart过程探索

    最近赖江山老师发布了一个R包: 原创R包:rdaenvpart(层次分割获取RDA和CCA单解释变量的贡献) http://wap.sciencenet.cn/home.php? mod=space&uid=267448&do=blog&id=1199315 将Hierarchical Partitioning与rda(cca)相结合,可得到单个环境因子的解释度。 之后就知道allR2是得到环境因子的各种组合与OTU做cca或rda后得到的R2,并作为最后的gfs(拟合的优异度)输出。 14行是另一个函数: partition.rda,用到了hier.part进行Hierarchical Partitioning。 的文章: 关于RDA中每个环境因子解释率的说明 http://wap.sciencenet.cn/home.php?

    93621发布于 2020-06-01
  • 来自专栏庄闪闪的R语言手册

    冗余分析

    上一次给大家介绍了如何用R语言进行主成分分析,今天介绍的主角也是PCA的好朋友噢,掌声欢迎我们的第二位小伙伴——冗余分析(RDA)。 1 冗余分析 简介 冗余分析(Redundancy Analysis,RDA),是一种回归分析结合主成分分析的排序方法。 RDA建模[1]的大致思想是先将响应变量矩阵与解释变量之间进行多元线性回归,再对得到的拟合值进行主成分分析。 在R语言的帮助页面里,使用的是fish数据集对RDA() 进行说明。 <- RDA(CLR(fishm), cov=vars) # 绘制冗余分析排序图 PLOT.RDA(fish.RDA, map="contribution", rescale=0.05, indcat

    6.8K30发布于 2021-04-09
  • 来自专栏拓端tecdat

    R语言线性分类判别LDA和二次分类判别QDA实例

    规范的判别分析 由于RDA是一种正则化技术,因此当存在许多潜在相关的特征时。现在让我们评估音素数据集上的RDA。 R中的RDA rda.preds <- predict(rda.model, t(train.set), train.responses, t(test.set)) #确定每个Alpha的性能 rda.perf <- vector(, dim(rda.preds)[1]) for(i in seq(dim(rda.preds)[1])) { <span style="color:#888888 ))) / length(test.responses)) <em>rda</em>.perf[[i]] <- res } <em>rda</em>.perf <- do.call(rbind, <em>rda</em>.perf) rownames(<em>rda</em>.perf <em>RDA</em>是一种正则化判别分析技术,对大量特征特别有用。

    3.2K30发布于 2020-11-03
  • 来自专栏生信小驿站

    单基因生信分析流程(6)单基因相似性分析

    library(SummarizedExperiment) expdat <- GDCprepare(query = query, save = TRUE, save.filename = "exp.<em>rda</em> ################################# rm(list=ls()) setwd('D:\\SCIwork\\F20ELFN1\\COAD') load('exp.<em>rda</em> ######################## setwd("D:\\Originaldata\\GRCH\\Homo_sapiens.GRCh38.90") load("gtf_df.Rda :unite(gene_id,gene_name,gene_id,gene_biotype,sep = " | ") save(mRNA_exprSet,file = "mRNA_exprSet.Rda ############################################################## rm(list=ls()) load( "mRNA_exprSet.Rda

    1.2K21发布于 2020-08-13
  • 来自专栏拓端tecdat

    R语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA

    这可能表明共同协方差的假设适合于该数据集 规范的判别分析 由于RDA是一种正则化技术,因此当存在许多潜在相关的特征时。现在让我们评估音素数据集上的RDA。 R中的RDA rda.preds <- predict(rda.model, t(train.set), train.responses, t(test.set)) # determine performance for each alpha rda.perf <- vector(, dim(rda.preds)[1]) for(i in seq(dim(rda.preds)[1])) { <span } rda.perf <- do.call(rbind, rda.perf) rownames(rda.perf) <- alphas 结论 判别分析对于多类问题特别有用。 RDA是一种正则化判别分析技术,对大量特征特别有用。

    3.5K20发布于 2020-07-17
  • 来自专栏用户画像

    FTRL

    article/details/83721843 一、算法原理 image.png 二、算法逻辑 image.png 三、个人理解 从loss function的形式来看:FTRL就是将RDA-L1 这样达到的效果是: 累积加和限定了新的迭代结果W**不要离“已迭代过的解”太远**; 因为调整后的解不会离迭代过的解太远,所以保证了每次找到让之前所有损失函数之和最小的参数; 保留的RDA-L1 由于使用了累积梯度,即使某一次迭代使某个重要特征约束为0,但如果后面这个特征慢慢变得稠密,它的参数又会变为非0; 保留的RDA-L1中关于累积梯度的项,与v相加,总会比原来的v大,加起来的绝对值更容易大于 稀疏靠RDA-L1,保留有效特征靠FOBOS-L1和RDA-L1的累积梯度思想。 小结: FOBOS-L1:使用MSE+L1对w_{t+1/2}进行建模,目标是使调整后的梯度在离SGD结果附近的基础上,产出稀疏解; RDA-L1:使用累积平均梯度 + L1 + L2进行建模

    1.8K30发布于 2018-12-06
  • 来自专栏Listenlii的生物信息笔记

    8.1-8.7 交流群问题汇总第7期

    物种与环境相关性的方法 问: 关于微生物物种与环境变量的相关性,用RDA分析和做Mantel Test有什么区别,除了能否表示出显著性外,用哪个更好些 答: mantel原理,之前文章中一张图有介绍: RDA原理: RDA, tb-RDA, CCA & db-RDA (constrained ordination) https://www.davidzeleny.net/anadat-r/doku.php /en:rda_cca 群落分析的冗余分析(RDA)概述 https://mp.weixin.qq.com/s?

    1.2K20发布于 2021-08-27
  • 来自专栏MeteoAI

    数据下载 | NCEP再分析数据自动批量下载

    数据介绍 数据下载自NCAR:https://rda.ucar.edu/ 需要自行注册账户,最好是edu结尾的邮箱。 NCEP的FNL资料:http://rda.ucar.edu/data/ds083.2 空间分辨率:1°×1° 时间分辨率:逐6小时 批量下载数据 import requests import datetime builtSession(): email = "xxxxxxxx" #此处改为注册邮箱 passwd = "xxxxxxxx" #此处为登陆密码 loginurl = "https://rda.ucar.edu suffix = "grib1" else: raise StandardError("DateTime excess limit") url = "http://rda.ucar.edu

    3.6K41发布于 2021-07-01
  • 来自专栏刘笑江的专栏

    在线学习方法概述

    为了解决这个问题,在线最优化算法如 TG [1]、FOBOS [2]、RDA [3]、FTRL [4,5,6] 应运而生,下面将介绍、对比这些算法。 RDA RDA 是 Simple Dual Averaging Scheme 的一个扩展,由 Lin Xiao 在 2009 发表 [3]。 RDA 更新策略,最小化:第一项,之前所有梯度的平均值(dual average);第二项,正则项;第三项,额外正则项。 FTRL-Proximal FTRL_Proximal 是 McMahan 在 2010 提出 [4],在 [5] 与 FOBOS RDA 对比,在 [6] 介绍了 Google FTRL 工程实践。 与 FOBOS 不同,FTRL 与 RDA 在估计梯度时使用了历史累计梯度信息,而不仅仅是上一轮梯度。 在 [5] 提出把全局学习率改成每个坐标自适应学习率,AUC 提升1%。 横向对比 ?

    1.2K10发布于 2019-12-30
  • 来自专栏拓端tecdat

    数量生态学冗余分析(RDA)分析植物多样性物种数据结果可视化|数据分享|附代码数据

    p=25564 最近我们被客户要求撰写关于冗余分析(RDA)的研究报告,包括一些图形和统计输出。 冗余分析(redundancy analysis,RDA)是一种回归分析结合主成分分析的排序方法,也是多因变量(multiresponse)回归分析的拓展。 从概念上讲,RDA是因变量矩阵与解释变量之间多元多重线性回归的拟合值矩阵的PCA分析 本报告对植物生态多样性数据做了分析。 冗余分析 首先,加载数据。 要加载数据,所有文件都必须在工作目录中。 head(suda) #  获得R^2和调整后的R^2 (sR2 <- RseAdj (spdj <- RseAdj$adj.r.sed) 以2型标尺 对物种数据制作 RDA三序图 scores arrows text # 绘制地貌单元中心点和它们的标签的绘图点 unimes  spusc <- scores points text ---- 本文摘选 《 R语言数量生态学冗余分析RDA

    1.3K00编辑于 2023-04-25
  • 来自专栏气python风雨

    数据获取 | 如何下载指定时间范围的1°分辨率的FNL数据

    /usr/bin/env python """ Python script to download selected files from rda.ucar.edu. /d083002/grib2/2024/2024.09/fnl_20240901_00_00.grib2', 'https://data.rda.ucar.edu/d083002/grib2/2024 /2024.09/fnl_20240901_06_00.grib2', 'https://data.rda.ucar.edu/d083002/grib2/2024/2024.09/fnl_20240901 _12_00.grib2', 'https://data.rda.ucar.edu/d083002/grib2/2024/2024.09/fnl_20240901_18_00.grib2' base_url = "https://data.rda.ucar.edu/d083002/grib2/{year}/{year}.

    74910编辑于 2024-12-05
  • 来自专栏EpiHub

    【Lesson1】R 机器学习流程及案例实现

    = train(diabetes ~ ., data=train, method = "rda", # compare all all=resamples(list(GBM = model_gbm,SVM=model_svm,RDA = model_rda)) summary(all) Call: summary.resamples(object = all) Models: GBM, SVM, RDA Number of resamples prob")[, "pos"]) } # Examine results for test set model_list = list(GBM = model_gbm,SVM=model_svm,RDA = model_rda) model_list_roc = model_list %>% map(test_roc, data = test) model_list_roc %>% map

    1.4K30编辑于 2022-11-03
  • 来自专栏生信小驿站

    三阴性乳腺癌提取和分析

    library(SummarizedExperiment) expdat <- GDCprepare(query = query, save = TRUE, save.filename = "exp.<em>rda</em> ######################################################################## rm(list=ls()) load('exp.<em>rda</em> ######################## setwd("D:\\Originaldata\\GRCH\\Homo_sapiens.GRCh38.90") load("gtf_df.Rda :unite(gene_id,gene_name,gene_id,gene_biotype,sep = " | ") save(mRNA_exprSet,file = "mRNA_exprSet.Rda mRNA_exprSet$gene_name <- NULL setwd('D:\\SCIwork\\F22\\brca') save(mRNA_exprSet, file = "mRNA_exprSet.<em>Rda</em>

    1.1K10发布于 2020-08-13
  • 来自专栏用户7627119的专栏

    R函数不会写,"抄"总会吧!

    axis.text = element_text(size = 14), axis.title = element_text(size = 16)) } 接下来我们来画火山图,数据是从DEGAll.rda 这个文件中来,具体如何生成这个文件和如何使用这个文件可以参考R的save,load函数和 .rda文件。 load("DEGAll.rda") #这里用到ggplot2这个包来画图 library(ggplot2) gdcVolcanoPlot(DEGAll) 你就会得到下面这张火山图,是不是很方便,不会写函数一样可以画火山图 关注公众号,后台回复"火山图",获取DEGAll.rda文件。 Reference: 1.R的save,load函数和 .rda文件 2.R函数 ?

    89810发布于 2020-10-23
  • 来自专栏数据猿

    深入机器学习系列之Factorization Machines & Online Optimization

    今天为大家带来《深入机器学习系列之Factorization Machines & Online Optimization》 Outline Online Optimization TG FOBOS RDA 简单截断法 截断梯度法(TG) FOBOS算法 RDA算法 FTRL算法 简单截断法 以k为窗口,当t/k不为整数时采用标准的SGD进行迭代,当t/k为整数时,采用如下权重更新方式: ? RDARDA 中,权重的更新策略是 ? 其中,线性项 ? 包含之前所有梯度与 W 乘积的平均值,正则项 ? 额外正则项 ? ? 是一个非负且非递减序列,h(W) 是一个辅助的严格凸函数。 L1—RDA 令 ? ? ? ? 采用类似FOBOS算法的方式,可以得到特征权重每一个维度的更新方式(具体过程参考原论文): ? 而 L1-RDA 中的截断阈值是一个常数,不随着 t 的变化而变化。因此,可以认为 L1-RDA 比 L1-FOBOS 在截断判定上更加 aggressive ,也就是说,更容易产生稀疏性。

    97020发布于 2019-07-18
领券