首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏育种数据分析之放飞自我

    R语言中dcast 和 melt的使用

    0.23017749 3 ID_3 y1 1.55870831 4 ID_4 y1 0.07050839 5 ID_5 y1 0.12928774 6 ID_6 y1 1.71506499 4. dcast 代码 dcast(data=re1,ID ~Loc) 结果 > dcast(data=re1,ID ~Loc) Using 'y' as value column. 0.24669188 4 4 1 rep1 -0.34754260 5 5 1 rep1 -0.95161857 6 6 1 rep1 -0.04502772 dcast 是长数据,变宽数据,因此ex1_re如果想要变回去,用dcast(ex1_re, Cul + Loc ~ variable), ~号左边是保持不变的列名,~右边是需要扩展的列名, 省略的value是需要填充的数据 > dcast(ex1_re,Cul+Loc~variable) Cul Loc rep1 rep2 rep3 1 1 1 -0.71040656

    6.3K20发布于 2019-07-28
  • 来自专栏大猫的R语言课堂

    Q&A:在melt和dcast之间反复横跳

    Q&A:在melt和dcast之间反复横跳 写在前面 各位水友大家好,自从上一次发布了改版的推文说明之后,大喵和村长收到了很多水友的问题,我们也对这些问题进行了回复,希望能对大家R语言的学习有所帮助,在此先谢谢各位的支持 (`姓名`) ][, dcast(.SD, `姓名` ~ variable, value.var = c("用药名称", "用法", "用量", "服药时间", "用药依从性"))] data 最后一部分代码则为melt的逆操作: data <- data[, dcast(.SD, `姓名` ~ variable, value.var = c("用药名称", "用法", "用量", "服药时间 150mg 25mg 1片 1年 1年 1年 规律 规律 规律 黄舜 盐酸吡格列酮(卡司平) NA NA 口服 NA NA 2片qd NA NA 1年 NA NA 规律 NA NA 在运用dcast时 长表和宽表之间的相互转换,有时会在数据清洗中用到,对melt和dcast两个函数的理解需要深入。

    86820编辑于 2022-04-14
  • 来自专栏育种数据分析之放飞自我

    R语言tryCatch使用方法:判断Warning和Error

    的报警信息: warning # 示例数据 library(data.table) dd = data.frame(ID = 1:10,y= rnorm(10)) dd # warning re1 = dcast (dd,y~.) re1 > re1 = dcast(dd,y~.) Use 'value.var' to override Warning message: In dcast(dd, y ~ .) : The dcast generic in data.table Please do this redirection yourself like reshape2::dcast(dd). warning处理代码 在代码中,写下warning的语句,在warning的条件下,返回2 在代码中,写下error的语句,在error的条件下,返回3 re1 = tryCatch({ dcast

    8.1K72发布于 2020-09-22
  • 来自专栏育种数据分析之放飞自我

    R语言tryCatch使用方法:判断Warning和Error

    (dd,y~.) re1 > re1 = dcast(dd,y~.) Use 'value.var' to override Warning message: In dcast(dd, y ~ .) : The dcast generic in data.table Please do this redirection yourself like reshape2::dcast(dd). 「error处理代码」 如果我们执行error的代码,那么他就re1=3,同时打印出error re1 = tryCatch({ # dcast(dd,y~.) # warning aaaaa 「这个时候,如果用tryCatch,它会捕捉到warning,而不是error」 「代码:」 re1 = tryCatch({ # dcast(dd,y~.) # warning # aaaaa

    1.1K20发布于 2021-01-27
  • 来自专栏YoungGy

    R语言包_reshape2

    head(md) head(airquality) dim(airquality) dim(md) # cast to data.frame # restore original data cd = dcast climate_value") head(cd) head(airquality) dim(cd) dim(airquality) # aggregate by month to get the mean value dcast month~climate_variable,value.var = "climate_value",fun.aggregate = mean, na.rm=T) # add margin dcast climate_value",fun.aggregate = mean, na.rm=T, margins=c("month","climate_variable") ) # use of ... dcast (md,month+day~...) # use of . dcast(md,month~.) table(md$month) # with plyr library(plyr) acast(md,climate_variable

    93820发布于 2019-05-26
  • 来自专栏大数据

    数据管理—reshape2包

    包含两个主要的函数,一个是melt融合函数,即把原来“宽型”数据变成一种“长型”;一个是dcast组合函数,即把“长型”的数据变回“宽型”的数据。 下面可以开始来了解reshape2的应用过程。 这里,我们先示例一下利用dcast进行重建表。如下图所示,我们建立了新的数据集包含变量AQI和PM2.5等五个指标,我们的基本目的达到了。 同时,上述的情况也并非error,这恰恰是我们利用dcast进行计算的一个方法,如下,我们可以使用简单的sum函数,汇总不同AQI中五项指标的值。 「 dcast 」 了解dcast 对于dcast的重铸和应用功能,小伙伴通过上面的例子应该已经有了大致的了解,所以,我们现在来了解一下dcast函数的构成: dcast(meltdata,id.vars1

    88900发布于 2017-12-27
  • 来自专栏生信补给站

    关于我只有基因和变异类型,还想做oncoplot(瀑布图)这件事!

    2.1 使用reshape2包的dcast函数 #尝试转化 dcast <- dcast(data, gene~ sample) head(dcast) 和想象的好像有点不一样,是不是有很多问号❓ dcast 看一下,发现fun.aggregate就是我们想要的参数, 下面再构建一个 完成逗号连接 的函数即可,这个使用paste即可 f.agg <- function(x) paste(x, collapse =";") OK,都准备好了,转成输入文件样式的宽型数据吧 f.agg <- function(x) paste(x, collapse =";") a <- dcast(data, gene~ sample

    2.1K20编辑于 2022-11-11
  • 来自专栏生物信息学、python、R、linux

    长宽数据转换

    主要用到两个函数:melt和cast melt:将wide-format数据“熔化”成long-format数据; dcast:获取long-format数据“重铸”成wide-format数据。 以上述两个表格转化为例: dcast:data1转化成data2,即保留年份和月份,将年龄组分别展开 data2<-dcast(data1,年份+月~年龄组) 合并数据到一列时使用melt,生成的variable

    1K50发布于 2020-06-02
  • 来自专栏生信补给站

    数据处理|数据框重铸

    那些能够区分不同行数据的变量共同作为变量),且修改长数据中的列名 airMelt2 <- melt(airquality, id.vars = c("month", "day"), 1.2 cast函数 (长转宽) dcast 比如,我们的ID variables不包含day, dcast(airMelt3, month ~ variable) 可以看到每个单元是month与climate组合的个数。 dcast(aql, month ~ variable, fun.aggregate = mean, na.rm = TRUE) 二 $、with、within、transform等进行列的添加 head

    98130发布于 2020-08-06
  • 来自专栏机器学习AI算法工程

    文本情感分析:特征提取(TFIDF指标)&随机森林模型实现

    `dcast`函数,原因在于它们的中间过程要进行矩阵的转换。 其中,data.table里的`dcast`函数比reshape2包里的`dcast`好用,尽管他们的参数都一样,但是很多人还是比较喜欢老朋友reshape2包,然而这一步需要大量的内存,本书在服务器上完成的 之后通过dcast函数形成了随机森林所要的数据结构,来进行后续的分析。 笔者自问自答: 图4是训练集服从随机森林模型dcast之后的图,而图6是测试集dcast之后的表,为啥他们的单词顺序都是一样的呢?如何才能严格符合训练集的数据结构呢? 答:dcast重排的时候,是按照term的名称大小写的顺序来写的,所以肯定和训练集的结构是一致的! 为什么图5中,一些词语的Id为0,而dcast之后,不存在0id的个案呢?

    9.8K50发布于 2018-03-13
  • 来自专栏生信宝典

    R包reshape2,轻松实现长、宽数据表格转换

    用month + day ~ variable告诉dcast月份和日期是变量,转换成的长数据与原始数据除了变量列的序号不一样,其他都一致。 aql <- melt(airquality, id.vars = c("month", "day")) aqw <- dcast(aql, month + day ~ variable) head(aqw 下面来一个错误示范,这次我们不再将day作为变量: dcast(aql, month ~ variable) ## month ozone solar.r wind temp ## 1 5 当我们转换数据并且每个单元格有多个值时,还需要使用fun.aggregate=告知dcast以什么方式重新组合数据,是平均值(mean)、中位数(median)还是总和(sum)。 dcast(aql, month ~ variable, fun.aggregate = mean, na.rm = TRUE) ## month ozone solar.r

    8.7K20发布于 2018-12-07
  • 来自专栏素质云笔记

    R语言︱情感分析—基于监督算法R语言实现(二)

    `dcast`函数,原因在于它们的中间过程要进行矩阵的转换。 其中,data.table里的`dcast`函数比reshape2包里的`dcast`好用,尽管他们的参数都一样,但是很多人还是比较喜欢老朋友reshape2包,然而这一步需要大量的内存,本书在服务器上完成的 之后通过dcast函数形成了随机森林所要的数据结构,来进行后续的分析。 笔者自问自答: 图4是训练集服从随机森林模型dcast之后的图,而图6是测试集dcast之后的表,为啥他们的单词顺序都是一样的呢?如何才能严格符合训练集的数据结构呢? 答:dcast重排的时候,是按照term的名称大小写的顺序来写的,所以肯定和训练集的结构是一致的! 为什么图5中,一些词语的Id为0,而dcast之后,不存在0id的个案呢?

    2.1K20发布于 2019-05-26
  • 来自专栏数据小魔方

    左手用R右手Python系列——数据塑型与长宽转换

    在R语言中,提供数据长宽转换的包主要有两个: reshape2::melt/dcast tidyr::gather/spread library("reshape2") library("tidyr") reshape2中的dcast函数可以完成数据长转宽的需求: dcast( data=data1, #数据集名称 Name+Conpany~Year #x1+x2 从以上代码的复杂度来看,reshape2内的两个函数melt\dcast和tidyr内的两个函数gather\spread相比,gather\spread这一对函数完胜,不愧是哈神的最新力作,tidyr 内的两个函数所需参数少,逻辑上更好理解,自始至终都围绕着data,key、value三个参数来进行设定,而相对老旧的包reshape2内的melt\dcast函数在参数配置上就显得不是很友好,他是围绕着一直不变的主字段来进行设定的 R语言: reshape2::melt reshape2::dcast tidyr::gather tidyr::spread Python: pandas-melt pandas-pivot_table

    3.2K60发布于 2018-04-11
  • 来自专栏生信补给站

    TCGA|根据somatic mutation绘制突变景观图(oncoplot)和基因词云

    "missense_variant","inframe_insertion")) %>% unique() #转成绘制热图的数据形式(宽型数据) library(reshape2) mut3_dcast <- mut3 %>% dcast(Sample_ID ~ gene,value.var='effect') %>% dplyr::select(Sample_ID, da$gene) %>% 2.2 ComplexHeatmap绘制突变景观图 library(ComplexHeatmap) library(circlize) mat <- mut3_dcast mat[is.na(mat)

    3.2K10发布于 2020-10-29
  • 来自专栏数据指象

    玩转数据:长宽变换

    140,139,129,135,121,109,150), 英语=c(111,123,141,101,99,130,140), 综合=c(125,115,119,130,121,113,130) ) 3.1 R方法reshape2包函数melt,dcast short2long = melt(data, id=c("班级","姓名"), variable.name= '科目', value.name = '成绩') #长变宽 long2short = dcast (short2long,班级+姓名~科目) 具体 dcast 的方法有汇总,求平均可以参考 R 官方文档。

    75210编辑于 2022-04-27
  • 来自专栏R语言学习

    R语言dataframe数据转换

    image.png 将长数据转换为宽数据 将上述df_melt转化为宽数据框df df_cast<-reshape2::dcast(df_melt,x~year,value.var="value") image.png dcast参数说明 Arguments formula casting formula, see details for specifics. fun.aggregate aggregation

    2.5K20发布于 2020-09-14
  • 来自专栏yw的数据分析

    R语言基因组数据分析可能会用到的data.table函数整理

    之间,默认80MB; nThread 用的核心数; showProgress 在工作台显示进程,当用file==""时,自动忽略此参数; verbose 是否交互和报告时间 dcast.data.table 铸造后(v4作为value) dcast(data, formula, fun.aggregate = NULL, sep = "_", ..., subset = NULL by ]语法做 但是如果我要将上述DT中的v3作为一个影响因素,作为tag,先按v1、v2汇总,再将对应的v4值分为v3=1和v3=2两类,查看v1、v2取值相同v3不同对应v4的情况,这个时候用dcast 在工作台产生交互信息,默认options(datatable.verbose=TRUE) 对于前面的DT,我现在将f和d开头的列名的列作为测量变量,如下 pattern函数下面会讲,这里再讲一下的是melt和dcast 再进行dcast

    4.4K10编辑于 2022-03-10
  • 来自专栏优雅R

    「R」使用reshape2包

    18 Ozone 6 ## 19 5 19 Ozone 30 ## 20 5 20 Ozone 11 一旦我们拥有融合后的数据,就可以使用dcast 铸造 dcast()读取已熔解的数据,并使用你提供的一个公式和一个可选的整合数据的函数将其重铸。 # 对每月结果求平均 dcast(md, Month ~ Class, mean) ## Using New_Value as value column: use value.var to override 8.94 83.9 ## 4 8 NA NA 8.79 84.0 ## 5 9 NA 167 10.18 76.9 # 对每天的所有变量结果求平均 dcast 104.6 101.8 100.8 ## 4 95.5 NA 96.4 109.8 105.8 93.3 ## 5 75.0 NA 73.6 58.2 80.6 NaN # 变回原来的 dcast

    81820发布于 2020-07-03
  • 来自专栏yw的数据分析

    gplots heatmap.2和ggplot2 geom_tile实现数据聚类和热图plot

    project/Gengyan/ONCOCNV_result/ONCOCNV_all_result.txt",sep="\t") dt <- CN_DT[cfDNATime=="cfDNA1"] wdt <- dcast project/Gengyan/ONCOCNV_result/ONCOCNV_all_result.txt",sep="\t") dt <- CN_DT[cfDNATime=="cfDNA1"] wdt <- dcast

    5.2K70发布于 2018-04-28
  • 来自专栏生信技能树

    不走寻常路的单细胞表达量矩阵读取

    selected > dim(ct) [1] 6182813 3 是稀疏矩阵的简化版,我略微思考了一下,做了一个简单的变幻: library(reshape2) tmp = dcast NA NA NA > dim(tmp) [1] 21892 3664 这个时候我们可以借助于r编程语言里面的reshape2包的dcast 函数进行数据转换,在 R 语言中,reshape2 包提供了 dcast() 函数,用于将数据框从长格式(long format)转换为宽格式(wide format)。 data.table::fread( f, data.table = F) head(ct) dim(ct) #ct[1:4,1:4] library(reshape2) tmp = dcast

    96410编辑于 2024-03-06
领券