为大数据而生hdfr5 概述 hdf5文件是一种大数据存储结构,除了目前介绍的hdf5r包之外,同时cran中的h5包,Bioconductor中的rhdf5也能够实现类似的功能。 简单开始 创建文件、分组和数据集 library(hdf5r) # 创建一个临时hdf5文件 test_filename <- tempfile(fileext = ".h<em>5</em>") # 读取hdf5文件, 它只能应用于类H5File的对象。 放入数据和删除数据 我们还希望能够读取数据、更改数据、扩展数据集并再次删除数据集。读取数据的方式与读取常规R数组和数据框的方式相同。 此外,只要任何对象仍然打开,文件就不能以常规方式重新打开,因为HDF5禁止文件被多次打开。 close all关闭文件以及与文件关联的所有对象。任何指向该对象的r6类都将自动失效。 file.h5$close_all() 结束语 以上内容为hdfr5包的基本功能,当然还有一些高级功能,涉及创建文件和数据类型的内容 love&peace
R包 多个函数的打包存放 相应的R包可实现特定的分析功能 R包包含函数、数据、帮助文件、描述文件 安装 R包来源有CRAN、Bioconductor、GitHub install.packages(tidyr jmzeng1314/idmap1") library("tidyr")#加载 devtools::install_local(“xxxx.zip”)#本地安装 安装后每次使用都要先加载,也可用来检验是否成功安装 载入包时回答提示信息尽量 no* 已经安装的包,可直接调用其中的函数 pheatmap::pheatmap(volcano)#包名::函数名 library(pheatmap) pheatmap(volcano) 学习R包的使用 browseVignettes("limma") #作者一手教程,不是每个包都有 ls("package:limma")#列出包中的函数等 引用自生信技能树 小洁老师
stringr包是Hadley Wickham大神贡献的R包之一,主要用于字符串的处理。对于经常需要对数据进行预处理的分析人员来说,简直是一把“利器”,可谓是上能屠龙,下能剔牙。 其用法相比于R自带的函数,更加简单明了。stringr包在我工作中,是属于频繁使用的R包之一。简单的用法也是深入我心,强烈推荐使用该包进行字符串的预处理。 #提取filepath 字母大小写转换 场景:在Excel中,查找匹配不区分大小写,但是在R中区分大小写,常出现在Excel中能查到到但是R中匹配不到的情况,故先预处理统一大小写再做匹配。 #大小写转换r.letter 检测 场景:常跟ifelse函数配合使用,对某一列字符串进行判断是否匹配。 多用于新建列 #检测df df$b df a b1 1 数字2 2 数字3 3 数字4 a 非数字5 b 非数字6 c 非数字 以上是本人较常用的stringr包函数,可以发现该包的语法简洁
今天继续学习R语言基础的R包使用,以R包:dplyr为例 数据准备 01 R包的安装 install.packages(“dplyr”) 或BiocManager::install(“dplyr”) #务必要打引号 02 R包的调用/加载 library(dplyr) 或require(dplyr) #这里不用引号 部分人可能会因为镜像的问题失败,解决方法https://mp.weixin.qq.com /s/XvKb5FjAGM6gYsxTw3tcWw 03 R包及数据准备 install.packages("dplyr") library(dplyr) test <- iris[c(1:2,51:52,101 经过这几期的R语言基础,你应该能够入门R了,渐渐的也要自己去学会看帮助文档,去搜报错,还记得怎么搜命令和R包的帮助文档吗? ? +命令 #搜命令帮助文档 help(package='R包') #搜R包帮助文档 如果你能独立处理这些问题,那么恭喜你,你的R应该没问题啦! 应该没问题了!!!!吧?
R包是多个函数的集合,具有详细的说明和示例。 本次以dplyr为例安装和加载R包镜像设置运行这两行代码options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))options (BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")安装R包安装命令:install.packages()或者BiocManager ,而bind_cols()函数则需要两个数据框有相同的行数函数和R包的学习方式快速查看函数帮助文档? dplylr可以用问号连接任何想知道使用方式的函数名称找R包介绍页面(善用搜索引擎,或者找帮助)##Vignettes这个单词硬翻译会翻译成“小插图”,其实就是作者写的网页版教程,不是每个R包都有的,可以运行代码试试看
在这篇文章中,我们将学习如何操控R中的字符串,主要用的是Biostrings包。 Getting started 如果你是第一次使用,请先用以下命令安装Biostrings包: source("http://bioconductor.org/biocLite.R") biocLite 我们将通过实际操作一些Biostrings包提供的函数去熟悉它做的是什么,又是如何实现的。 Generating DNA alphabets R 提供了函数生成大写和小写的字母表。 5 10 6 ## [6] 6 10 5 我们现在来创建一个函数,用基本的R绘制函数画一下IRanges对象。 如果你还没有下载好bioconductor包,可以使用下面的命令: source("http://bioconductor.org/biocLite.R") biocLite("BSgenome.Hsapiens.UCSC.hg19
这几天收到师兄的任务,熟悉iGRaph包的使用,通过查资料,外加自己的实践,在此做个简单的学习笔记。 以下例子均是在R 3.0.1版本下测试的。 1.用igraph创建图表 g<- graph(c(1,2, 1,3, 1,4, 2,4, 3,4), directed=T) > g IGRAPH D--- 4 5 -- > plot(g , loops (g/x), p (g/n) > plot(g, layout=layout.fruchterman.reingold, vertex.label=NA, vertex.size=5, g/c), loops (g/x), m (g/n) > plot(g, layout=layout.reingold.tilford, vertex.label=NA, vertex.size=5, 9)[[1]] > pa [1] 5 3 9 > V(g)[pa]$color <- 'green' > E(g)$color <- 'grey' > E(g, path=pa)$color <- '
安装加载R包R包安装命令是install.packages(“包”)或者BiocManager::install(“包”)。取决于你要安装的包存在于CRAN网站还是Biocductor。 使用一个包,是需要先安装再加载options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) options(BioC_mirror # 3 virginica 6.05 0.354管道操作 %>% (cmd/ctr + shift + M)(加载任意一个tidyverse包即可用管道符号 , by = 'x')## x y z## 1 a 1 ## 2 b 2 A## 3 c 3 ## 4 d 4 ## 5 e 5 B## 6 f 6 C3.全连full_join y项中除非交集外的其他部分anti_join(x = test2, y = test1, by = 'x')## x y## 1 a 1## 2 c 3## 3 d 46.简单合并在相当于base包里的
说实话,自从之前好好学习了一下入门的R以后,一直没有用过R,很多东西都忘了,还是需要靠做笔记方便日后查阅。 本期讲一下R包的几种来源以及安装指定版本R包的几种方法。 R包来源及安装方法 1. CRAN网站 可以理解为R包的官网,凡是需要通过CRAN下载的R包,都可以通过install.packages("pkg_name")来安装。 2. application/zip' length 3371192 bytes (3.2 MB) downloaded 3.2 MB package ‘edgeR’ successfully unpacked and MD5 安装指定版本R包 复现文章或R包的更新与当前的R版本或R代码不兼容时,就需要考虑安装某个特定版本的R包了,这里列一些常见的安装指定版本R包的方法供大家参考。 源码安装 在这里也许能找到你需要的R包历史版本。
> plot(iris[,1],col = iris[,5]) #按照第五列给每个点分配颜色 > plot(iris[,2],col = iris[,5]) > plot(iris[,3],col = iris[,5]) > plot(iris[,4],col = iris[,5]) #当一个代码需要复制粘贴三次,就应该写成函数或使用循环,用新的函数进行代替 > jimmy <- function(i > m2d=function(x){+mean(x)+2*sd(x)} #sd()是标准差 不会是一个值 > m2d(rnorm(10)) [1] 1.738949 R包 介绍 R包都在哪里 #### #表格文件读到R语言中,就得到了一个数据框,对数据框进行的修改不会同步到表格文件,需重新导出 分隔符 常见的分隔符:逗号、空格、制表符(\t) 将表格文件读取到R语言中 read.table() # " 5.将soft导出为csv >write.csv(soft,file = "soft.csv") 6.将soft保存为Rdata并加载。
问题 你想安装和使用一个 R 包。 这里主要介绍如何用命令行来安装 R 包,如下所示: install.packages("reshape2") # reshap2为包名 在一个新 R 线程中使用该包之前,你必须先导入它。 R包 remove.packages 移除一系列已安装的R包 installed.packages 将已经安装的R包更新到最新版本 setRepositories 设定当前的R包的资源库列表 通过命令行安装 R 包 R CMD INSTALL aplpack_1.1.1.tgz # 安装aplpack包 从其他资源库安装 R 包 devtools 包提供了从其他流行的 Git 资源库或其他 URL 上安装 R 包的工具。
介绍这个包扩展了ggplot2,提供了用于对齐和组织多个图的高级工具,特别是那些自动重新排序观察结果的工具,比如树形图。 create complex, publication-quality visualizations while still using the familiar grammar of ggplot2.案例安装R包 install.packages("ggalign")install.packages("ggalign", repos = c("https://yunuuuu.r-universe.dev" margin())stack_alignh(mat_scaled) + stack_active(sizes = c(0.2, 1, 1)) + # group stack rows into 5 groups align_kmeans(centers = 5L) + # add a block plot for each group in the stack ggalign(size
PART1 开篇前言 本期R语言教程,暂定分为两大部分:第一部分为“R语言快速入门和数据处理”,第二部分为“R语言可视化及绘图”。 关于R和RStudio安装在这里就不再介绍了,网上有很多相关内容,如果安装过程有困难可以后台私信我。 PS.本次内容为R包安装及初识向量。 ? PART2 R包安装 问:什么是R包? 答:包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。它们提供了种类繁多的默认函数和数据集。 (对于刚接触R的同学来说可能看起来比较抽象,但是没关系,我们会在后续的学习中慢慢了解R包的概念) 1.R包安装:第一次安装一个包,使用命令install.packages()即可。 中 2.R包载入:安装完成后,想要调用这个包中的命令、数据等信息,就需要先载入这个包,需要用到的命令为library()。
vignettes/tm.pdf tm手册 : http://mirror.bjtu.edu.cn/cran/web/packages/tm/tm.pdf 简介 tm 即text mining,是用来做文本挖掘的一个R包 ,是一个进行自然语言处理的基础包。 安装 该包的安装方法是install.packages("tm") 数据输入—文集(corpus) 文集代表一个文档集,通常一个文件就是一个文档。多个文档构成一个文集。 0 0 0 0#> 248 0 1 0 0 文档-单词矩阵的操作 有了矩阵以后,可以有很多R函数可以作用于它 27 4#> 273 5 4 0 5 1 5 21 1#> 349 2 0 0 3 1 1 5 0#> 352
R包概述 R包是什么 R包,类似C、Python中库的概念,指包含特定领域的函数、数据、文档等的集合。通过调用包,可以直接使用包中现成的数据、函数等,使开发方便快捷高效。 为什么学习R包 R的强大在于包含了各种各样的包,使用包非常有利于便捷开发。 一些功能在现有的包中并不存在,需要自己实现,实现后通过打包方便代码的复用。 R包的结构 创建R包后,在包的根目录下,一般包含以下几个部分(粗体表示必需): R/: R函数目录,包含包中定义的函数。 DESCRIPTION:包的描述,包括包名、作者、依赖等。 man/: R函数手册目录,包含了包中定义函数的手册。 vignettes/: R项目目录,包含了本项目的使用指导。 tests/: R函数测试目录,包含了包中定义函数的测试及包功能的测试。 data/: 包中附带的数据文件。 R包的工作流程 为了有效利用R包,一般遵循以下的工作流程: 指定名字,创建R包,并编写DESCRIPTION文件,对R包进行简单的描述。
R包开发 创建R包基本流程: 开发工具:devtools 运行调试 + usethis 创建修改 基本流程: create_package 创建一个R包 use_r()写函数,插入roxygen注释和 tag,使用document()生成文档 load_all()载入包 use_***_license 添加license install安装包 use_testthat() 和use_test()生成测试文件 ) -> R/*.R -> 添加R函数脚本(合并因子) usethis::use_r("fbind") fbind <- function(a, b) { factor(c(as.character : use_package() -> `DESCRIPTION`文件添加 `Imports::forcats` use_package("forcats") R包readme说明文件:use_readme_rmd dplyr调出 创建包:usethis::create_package(path) 工作路径最好是源码包的top-level 参考: R packages 2nd edition cheatsheet
brown, grey light blue ## 7 Beru Whitesun lars brown light blue ## 8 R5 -D2 96 32 34.7 ## 4 R5-D4 97 32 34.0 ## 5 R4-P17 96 NA NA ## 6 BB8 函数式编程 用R写循环从低到高有三种境界:手动 for 循环,apply 函数族,purrr 包泛函式编程。 [4] 数据重塑之tidyr包: https://zhuanlan.zhihu.com/p/22265154 [5] Introduction to dplyr: https://cran.r-project.org [9] R语言| 向量化操作purrr包: https://www.huaweicloud.com/articles/f522c9f56cf2d8cca5f7b390aa3f2d7c.html [10
Sig2` = mean(Sig2), `Sig3` = mean(Sig3), `Sig4` = mean(Sig4), `Sig5` = mean(Sig5), `Sig6` = mean(Sig6)) count(x, ..., wt = NULL, sort = FALSE)按照...这个列内容是否相同的进行分组 3.4 1.6 0.2 setosa 4 4.8 3.0 1.4 0.1 setosa 5 3.2 1.3 0.2 setosa 4 4 4.6 3.1 1.5 0.2 setosa 5 5 5.0 3.6 1.4 0.2 setosa 6 6 5.4 3.9 1.7
简介 平常在各种R语言群里,总会遇到关于安装R包的问题,例如:搭载在github上的R包,由于网速(外网)原因而无法下载该怎么办? 这里小编分享下平常逼不得已才使用的“下三滥”方法——直接下载包,通过本地安装。 网上好多解决方案都是基于R gui的,但现实中使用Rstudio这个IDE会更多些。 接下来以gmm包在Rstudio下安装为例: 教程 使用bing搜索该包,找到相应网站[1]。 关键词:R包名称+R,或者可以再加上CRAN。 ? 搜索技巧:R包名称+R 找到Downloads板块,下载对应的压缩包 这里以mac为例 ? 参考资料 [1] gmm包对应网站: https://cran.r-project.org/web/packages/ggm/index.html