1.安装和加载
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")):
options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/"):
install.packages("dplyr"):
dplyr 的R包。dplyr 是一个流行的数据操作包,提供了一系列的函数用于快速进行数据操作,如选择、过滤、排序、汇总等。library(dplyr):
dplyr 包,使其函数可以在当前R会话中使用。安装Rtools包
https://cran.rstudio.com/bin/windows/Rtools/
Installing package into ‘C:/Users/Lenovo/AppData/Local/R/win-library/4.4’2.熟悉dplyr五个基础函数
mutate() 函数是 dplyr 包提供的一个用于修改数据框(data frame)的函数,它可以创建新的列或者修改现有的列。
mutate(.data, new_column_name = expression)
mutate(test, new = Sepal.Length * Sepal.Width)##在数据框 test 中,创建一个名为 new 的新列,该列的每个值是对应行中 Sepal.Length 和 Sepal.Width 的乘积

select(test,1)##从数据框 test 中选择第一列。
select() 函数是 dplyr 包提供的一个用于选择数据框(data frame)中特定列的函数。select() 函数的基本语法如下:
select(.data, column_name_1, column_name_2, ...).data:需要选择列的数据框。column_name_1,column_name_2,...:你想要从数据框中选择的列的名称。filter(test, Species == "setosa")####从数据框 test 中选择setosa行。
filter(.data, condition).data:需要筛选行的数据框。condition:一个逻辑表达式,用于判定每行是否应该被包含在结果中。
arrange(test, Sepal.Length)###按照Sepal.Length列从小到大排序
summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。