首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信菜鸟团

    dplyr-cli:在Linux Terminal上直接执行dplyr

    对于这个问题,今天即将需要介绍的 dplyr-cli就能很好的解决这个问题。 dplyr包的介绍 首先再和大家简单介绍一下 dplyr包(避免有些刚入门的朋友可能不熟悉)。 %>% 随机抽样函数 sample_n,sample_frac dplyr-cli的介绍 了解完 dplyr包之后,就要介绍咱们这个推文的主角了 dplyr-cli。 dplyr-cli设计的初衷就是让我们能够方便快速的在不打开R的情况下,在命令行中运行 dplyr,处理csv的文件。 dplyr-cli/dplyr . /dplyr --help Warning message:package ‘dplyr’ was built under R version 3.5.2dplyr-cli Usage: dplyr

    2.7K10发布于 2020-05-19
  • 来自专栏优雅R

    「R」dplyr 编程

    来源:vignettes/programming.Rmd[2] 大多数 dplyr 函数使用非标准计算(NSE)。这是一个术语——意味着它们不遵循通常的计算规则。 这让 dplyr 代码有两个主要优点: 数据框的操作可以简洁地表达,因为你不需要重复输入数据框名称。 有两个主要缺点: 大多数dplyr参数不是透明。这意味着你不能用一个看似等价的对象代替一个在别处定义的值。 幸运的是,dplyr 提供了克服这些挑战的工具。他们需要多一点打字,但少量的前期工作是值得的,因为他们从长远来看可以帮助你节省时间。 这篇文章有两个目标: 演示如何使用dplyr的pronouns和quasiquotation编写可靠的函数,以减少数据分析代码中的重复。

    1.5K20发布于 2020-07-03
  • 来自专栏火星娃统计

    dplyr_下篇

    dplyr_newversion sunqi 2020/6/9 ##概述 dplyr下篇 library(dplyr) ## ## Attaching package: 'dplyr' ## The following 10.2 ## 6 5.4 3.9 1.7 0.4 setosa 11.4 当然上述的方式通过r语言的一些简单操作也可以实现,但是dplyr 5.6 0.25 ## 5 versicolor 5.9 0.5 ## 6 versicolor 6.3 0.75 结束语 关于dplyr

    1K20发布于 2020-09-15
  • 来自专栏R语言学习

    dplyr包summarize的使用

    cyl有4,6,8三种取值,而gear有3,4,5三种取值,应该一共有9组,但我们这里只有8组,原因是cyl=8,gear=4的没有,默认不填补缺失值就会被 drop 掉

    1.3K20发布于 2020-09-14
  • 来自专栏TechBlog

    R语言之 dplyr

    dplyr 包里处理数据框的所有函数的第一个参数都是数据框名。 下面以 MASS 包里的 birthwt 数据集为例,介绍 dplyr 包里常用函数的用法。 library(dplyr) data(birthwt, package = "MASS") # ??birthwt 数据集 birthwt 里一共包含 189 个研究对象、10 个变量。 为了避免混淆,我们可以使用符号 :: 特别指明使用某一个包里的函数,例如 dplyr::select( )。之后我们将会对函数 select( ) 作进一步介绍。 tibble 是 tidyverse 系列包(包括 dplyr 包)提供的一种类似数据框的格式。 例如: c(2, 4, 6, 8) %>% matrix(nrow = 2) 因为 dplyr 包里面的函数第一个参数总是数据框,所以这些函数配合传递操作符处理数据框非常方便。

    1.9K20编辑于 2023-10-13
  • 来自专栏优雅R

    「R」dplyr 列式计算

    ❝在近期使用 「dplyr」 进行多列选择性操作,如 mutate_at() 时,发现文档提示一系列的 「dplyr」 函数变体已经过期,看来后续要退休了,使用 across() 是它们的统一替代品,所以最近抽时间针对性的学习和翻译下 原文来自 [dplyr 文档](Column-wise operations • dplyr (tidyverse.org "dplyr 文档")) - 2021-01❞ 同时对数据框的多列执行相同的函数操作经常有用 但你也可以联合 across() 和任意其他的 「dplyr」 动词函数,我们后面会提及。 这使 「dplyr」 更容易使用(因为需要记住的函数更少),也使我们更容易实现新的动词(因为我们只需要实现一个函数,而不是四个)。 _at() 函数是 「dplyr」 中唯一你需要手动引用变量名的地方,这让它们比较奇怪且难以记忆。 为什么过了这么久才发现 across()?

    3.4K10编辑于 2022-01-21
  • 来自专栏生信学习

    常用R包-dplyr

    dplyr是一个在R语言中非常流行的数据处理包,它提供了许多功能强大且易于使用的函数,包括 select、 filter、mutate、arrange和summarize 等。 这些功能使得dplyr成为数据清洗、处理和分析的首选包。 一、安装和加载R包 镜像设置(清华源和中科大源)options——安装install——加载library/ require CRAN网站R包安装命令 install.packages("dplyr") /CRAN/"))  options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")  install.packages("dplyr") library (dplyr) 二、首先创建示例数据框 仍直接使用内置数据集iris,并简化 test <- iris[c(1:2,51:52,101:102),] 三、dplyr基础函数 1、filter()筛选行

    1.6K10编辑于 2024-04-19
  • 来自专栏优雅R

    「R」dplyr 包使用

    summary()函数会对 列 进行处理,并且 创建新的列表 ,简单来说就是把向量作为输入值,输出单个数值。

    1.6K20发布于 2020-07-03
  • 来自专栏生信菜鸟团

    R tips:dplyr编程

    dplyr的函数由于使用tidy evaluation(R中的一种非标准执行(NSE)实现方式)的方法,可以使得其具有更好的易用性:变量不需要绝对引用和引号包裹。 根据使用的NSE的类别不同,dplyr的函数可以分为两类: data masking:arrange(), count(), filter(), group_by(), mutate(), summarise 根据所用的NSE的类别,需要区别对待dplyr函数的编程。 Data masking 如果想要操作的数据变量名称来源于环境变量,那么使用特殊的指代词.data来完成。 4 # Hornet 4 Drive 6 # Hornet Sportabout 8 # Valiant 6 参考资料 Programming with dplyr :https://dplyr.tidyverse.org/articles/programming.html

    1.5K30发布于 2020-07-02
  • 来自专栏生信喵实验柴

    dplyr数据处理

    library(dplyr) dplyr::filter(iris,Sepal.Length >7) dplyr::filter(mtcars,mpg>21) dplyr::filter(mtcars, dplyr::arrange(mtcars,mpg) dplyr::arrange(mtcars,desc(mpg)) 三、利用管道 合并多个操作,过滤后排序,%>%快捷键是ctrl+shift mtcars %>% dplyr::filter(mpg>20) mtcars %>% dplyr::filter(mpg>20) %>% dplyr::arrange(cyl) 四、筛选过滤列 select ::left_join(a,b,by="x1") dplyr::right_join(a,b,by="x1") dplyr::left_join(b,a,by="x1") dplyr::full_join (a,b,by="x1") dplyr::semi_join(a,b,by="x1") dplyr::anti_join(a,b,by="x1") dplyr::anti_join(b,a,by="x1

    2.4K10编辑于 2022-10-25
  • 来自专栏医学和生信笔记

    dplyr强大的分组汇总

    dplyr为我们提供了group_by()函数,主要使用group_by()对数据进行分组,然后再进行各种计算,通过和其他操作进行连接,发挥更加强大的作用。

    2.1K30编辑于 2022-11-15
  • 来自专栏EpiHub

    R数据科学-1(dplyr

    R数据科学(dplyr) 如今数据分析如火如荼,R与Python大行其道。你还在用Excel整理数据么,你还在用spss整理数据么。 忘记保存,白费时间 效率低,时间长 现在,我们将学习对处理数据有用的两个软件包: dplyr是用于简化表格数据操作的软件包。 tidyr使您可以在不同的数据格式之间快速转换。 # … with 22 more rows 3.数据-变量条件筛选 dplyr::filter()函数对上述新产生的变量的数据df,进行筛选。 new=mpg*cyl) df %>% dplyr::filter(am==1) df %>% dplyr::filter(am==1 & gear==4) 5.数据分组计算 有时候,需要分组计算均值标准差 • dplyr R for Data Science

    2.3K20编辑于 2022-10-25
  • 来自专栏医学和生信笔记

    dplyr中的行操作

    但有时候我们也需要对某行做一些操作,dplyr中现在提供了rowwise()函数快速执行对行的操作。 简介 library(dplyr, warn.conflicts = FALSE) “rowwise()和group_by()很像,本身不做任何操作,但是使用了rowwise之后,再和mutate()

    2.4K30编辑于 2022-11-15
  • 来自专栏医学和生信笔记

    dplyr中的across操作

    dplyr中的across函数取代了之前的xx_if/xx_at/xx_all,用法更加灵活,初学时觉得不如xx_if/xx_at/xx_all简单易懂,用习惯后真是利器! 主要是介绍across函数的用法,这是dplyr1.0才出来的一个函数,大大简化了代码 可用于对多列做同一个操作。 一般用法 陷阱 across其他连用 和filter()连用 一般用法 library(dplyr, warn.conflicts = FALSE) across()有两个基本参数: .cols:选择你想操作的列

    1.1K30编辑于 2022-11-15
  • 来自专栏优雅R

    「R」dplyr 行式计算

    「原文来自:dplyr 文档」 上一篇:「R」dplyr 列式计算 通常 dplyr 和 R 更适合对列进行操作,而对行操作则显得更麻烦。 这篇文章,我们将学习围绕rowwise() 创建的 row-wise 数据框的 dplyr 操作方法。 本文将讨论 3 种常见的使用案例: 按行聚合(例如,计算 x, y, z 的均值)。 It doesn’t have to be you. — Jenny Bryan❞ 载入包 library(dplyr, warn.conflicts = FALSE) 创建 行式操作需要一个特殊的分组类型 按行汇总统计 dplyr::summarise() 让一列多行的统计汇总变得非常简单,当它与 rowwise() 结合时,它也可以简便地操作汇总一行多列。 do() 我们对 do()的必要性已经质疑了很长一段时间,因为它与其他 dplyr 动词并不太相似。它有两种主要的运作模式: 没有参数名:你可以调用函数来输入和输出数据框。引用“当前”组。

    7.3K20编辑于 2022-01-21
  • 来自专栏生信补给站

    数据处理|R-dplyr

    dplyr包实现数据的清洗处理,包括数据整合、关联、排序、筛选、汇总、分组等。 1)安装、加载dplyr包、准备数据 install.packages("dplyr") #加载dplyr包 使用dplyr包处理数据前,建议先将数据集转换为tbl对象。 Q:按品种分组,分别计算花萼宽度的均方差 summarise(group_by(iris,Species),sd=sd(Petal.Width)) 8)连接操作符 dplyr包里还新引进了一个操作符,% 11)数据合并 dplyr包中也添加了类似cbind()函数和rbind()函数功能的函数,它们是bind_cols()函数和bind_rows()函数。 查看自带的参考资料:vignette(package = "dplyr") vignette("introduction", package = "dplyr")

    2.8K10发布于 2020-08-06
  • 来自专栏生物信息学_troubleshooting

    case_when function in dplyr package

    例如: Sample_Name = OR2, 就在其添加的carHLH列中的对应空格填写carHLH(+),

    38230编辑于 2023-08-23
  • 来自专栏生物信息学、python、R、linux

    使用dplyr进行数据转换

    library(nycflights13) library(tidyverse) dplyr最常用的5个函数: • 按值筛选观测(filter())。

    1.6K10发布于 2020-04-01
  • 来自专栏R语言学习

    使用dplyr包对表格整理

    R自带的对数据框添加新的行或列函数为cbind()和rbind(),对应于dplyr包的bind_cols()和bind_rows()。使用这两个函数要求数据能很好的对应。

    92910发布于 2020-09-14
  • 来自专栏火星娃统计

    dplyr_new version-across

    dplyr_new version sunqi 2020/6/8 概述 2020年5月29日,dplyr迎来来大更新,作为大版本的更新,还是有必要进行学习一下 安装 # remove.packages ("dplyr") # install.packages("dplyr") across 和mutate合用 Note that the echo = FALSE parameter was added 5.4 2.3 virginica ## 101 5.9 3.0 5.1 1.8 virginica 结束语 dplyr

    55230发布于 2020-09-15
领券