首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信学习~~~

    R4R语言作图

    ---title: "note4"output: html_documentdate: "2023-05-16"---R Markdown#设置镜像options("repos"=c(CRAN="http ://mirrors.tuna.tsinghua.edu.cn/CRAN/"))#安装R包if(! library(eoffice)library(patchwork)#作图分三类#1.基础包 略显陈旧 了解一下plot(iris[,1],iris[,3],col = iris[,5]) text(6.5,4, labels = 'hello')#在6.5,4坐标处加上hellodev.off() #关闭画板#2.ggplot2 中坚力量,语法有个性,theme_bw()+#把灰色主题背景去掉,theme_classic x="Sepal.Length", y="Petal.Length", color="Species")#ggplot2语法1入门级绘图模板,2映射,3分面,4几何对象

    1.1K20编辑于 2023-05-17
  • 来自专栏生信矿工

    R语言笔记-4

    生信技能树-数据挖掘课程笔记 文件读写 #读取csv文件 csv = read.csv(“test.csv”) csv = read.csv("test.csv",header = T) #将第一行作为列名 csv = read.csv("test.csv",row.names = 1,check.names = F) #将第一列作为行名,并不检查特殊符号 # 数据框不允许有重复的行名 #读取txt文件 txt = read.table("test.txt") txt = read.table("test

    50010编辑于 2023-05-21
  • 来自专栏我的生物信息菜鸟学习笔记

    day4-R

    1、认识R和RstudioR是一种编程语言,主要用于统计计算和绘图,有很多函数。Rstudio是开源集成开发环境,让R的“内饰”更好。 2、设置字体大小Tools-Global Options-Appearance-editor foot size-Apply3、R语言基本操作1、用Rproject管理目录file-new project-new 文件的前缀)-选择位置-create project来自生信技能树2、显示文件列表dir()这条代码可以显示工作目录3、加减乘除3+53-53*53/53^5sqrt(9)abs(-3)log2(8)4、 赋值x<-1#给x赋值为1x#输出x5、删除变量a<-3b <- 1c <- 4u <- 5+6rm(b)rm(u,c) rm(list = ls())#清空所有变量6、列出历史命令history()

    23910编辑于 2024-10-25
  • 来自专栏Hank’s Blog

    4-4 R语言函数 tapply

    #对向量的子集进行操作 #tapply(参数):tapply(向量,因子/因子列表,函数/函数名) > x <- c(rnorm(5),runif(5),rnorm(5,1)) > f <- gl(3,5) > f [1] 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 Levels: 1 2 3 > tapply(x,f,mean) 1 2 3 -0.5004154 0.4044779 0.9769996 > tapply

    37010发布于 2020-09-16
  • 来自专栏python3

    Python 爬虫4

    driver.find_element_by_tag_name(“input”) 3. find_element_by_class_name(‘input-class’)     #根绝class定位 4. contiune并且type属性为button的input元素://input[@name='continue'][@type='button'] 查找页面上id为loginForm的form元素下第4个 input元素://form[@id='loginForm']/input[4] 控件操作: 输入框; element.clear()   #清空输入框数据 element.sendkeys(“username minS, maxS):     time.sleep((maxS - minS) * random.random() + minS)      browser = webdriver.Chrome(r"C minS, maxS):     time.sleep((maxS - minS) * random.random() + minS)      browser = webdriver.Chrome(r"C

    1.2K30发布于 2020-01-10
  • 来自专栏python3

    Python-爬虫03:urllib.r

    is None: _opener = opener = build_opener() else: opener = _opener # 知识点4: 也就是说,上面的4行代码就已经帮我们把百度的首页的全部代码爬了下来。 浏览器 就是互联网世界上公认被允许的身份,如果我们希望我们的爬虫程序更像一个真实用户,那我们第一步就是需要伪装成一个被浏览器。 gzip, deflate, br Accept-Language: zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7,en-CA;q=0.6 Cookie: BAIDUID=4F583A04A0193EBE0C9849C551B9305C :FG=1; BIDUPSID=4F583A04A0193EBE0C9849C551B9305C; PSTM=1545978093; BD_UPN=12314753; BDORZ=B490B5EBF6F3CD402E515D22BCDA1598

    84320发布于 2020-01-19
  • Day 4 R语言基础

    下载RR studio2. 认识R和RstudioR是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能。 RStudio提供了一个具有很多功能的环境,使R更容易使用,是在终端中使用R的绝佳选择。 4.历史窗口(history)(右上窗口):展示了在控制台执行过的表达式。可以重复执行。5.文件窗口(files)(右下窗口):展示了当前文件夹中的文件列表。 R语言基本操作3.1 利用Rproject管理工作目录所谓工作目录就是默认的读取和储存位置,也就是说,R语言只能和一个文件夹进行互动,这个文件夹非常重要,做不好就会导致你的脚本、文件、图片各种乱跑,找不到 3.4 删除变量代码是rma<-3b <- 1c <- 4u <- 5+6rm(b)rm(u,c) rm(list = ls())#清空所有变量3.5 列出历史命令history() 相当于鼠标单击右上角的

    37000编辑于 2024-06-10
  • Day4-R基础

    建立Rproject使同一项目的所有脚本和数据都在同一个目录下常用脚本1.显示该目录下文件列表 dir()2.加减乘除:在控制台中输入1+2,2-1,2*3,4/2,log,然后回车3.赋值:在脚本编辑器中输入 x <- 1+2,运行(run),即把1+2的结果赋值给x,在控制台中直接输入x 回车,就会把x的值(3)打印到控制台上4.删除变量:rm(a)即删除a rm(list = ls())即清空所有变量

    25900编辑于 2024-03-25
  • 来自专栏机器学习与统计学

    R Programming week 4 simulation

    Generating Random Numbers Functions for probability distributions in R rnorm: generate random Normal The functions are prefixed with a d for density r for random number generation p for cumulative distribution (scalar) objects allowing you to sample from arbitrary distributions. > set.seed(1) > sample(1:10, 4) [1] 3 4 5 7 > sample(1:10, 4) [1] 3 9 8 5 > sample(letters, 5) [1] "q" "b" "e" "x" "p" > sample(1:10 ) ## permutation [1] 4 710 6 9 2 8 3 1 5 > sample(1:10) [1] 2 3 4 1 9 5 10 8 6 7 > sample(1:10, replace

    45430发布于 2019-04-10
  • 来自专栏python学习指南

    Python爬虫(十五)_案例:使用bs4爬虫

    本章将从Python案例讲起:所使用bs4做一个简单的爬虫案例,更多内容请参考:Python学习指南 案例:使用BeautifulSoup的爬虫 我们已腾讯社招页面来做演示:http://hr.tencent.com 使用BeautifulSoup4解析器,将招聘网页上的职位名称、职位类别、招聘人数、工作地点、时间、以及每个职位详情的点击链接存储出来。 #-*- coding:utf-8 -*- from bs4 import BeautifulSoup import urllib2 import urllib import json #使用json get_text() workLocation = site.select('td')[3].get_text() publishTime = site.select('td')[4]

    1.2K60发布于 2018-01-17
  • 来自专栏生信补给站

    R编程之路(4

    runif(10,min=0,max=1)#产生10个最小值为0,最大值为1的随机数

    31320发布于 2020-08-06
  • 来自专栏机器学习养成记

    R语言爬虫与文本分析

    之前用python做过简单的爬虫与分析,今天尝试一下用R完成相应的功能。首先用R爬取了《了不起的麦瑟尔夫人》豆瓣短评作为语料,然后进行了词云绘制、关键词提取的基本操作。 代码实现 R语言中,有两种进行数据获取的方式。一种是RCurl包+XML包,过程与python中的urllib与bs4相似,先读取网页代码再对html代码进行解析。 用wordcloud2绘制词云的方法在十九大讲话文本分析(R语言)中也有介绍,本次我们用自定义图片的方式设置词云形状,即设置figPath参数,注意,图片需要存放在wordcloud2中默认的文件夹下,

    2.3K140发布于 2018-04-10
  • R语言 Day4

    #R语言 Day4 r语言安装 官网安装 用户名记得改为英文 plot和runif什么意思 在R语言中,plot()是一个函数,用于创建图形或绘制数据的可视化。 dir与list.files区别 在R语言中,dir()和list.files()都是用于获取文件系统中文件和目录列表的函数,但它们有些许不同之处。

    41010编辑于 2024-02-23
  • 来自专栏庄闪闪的R语言手册

    R沟通|Rmarkdown教程(4

    rmarkdown/rticles-templates.html rticles软件包提供了各种期刊和出版商的模板: JSS articles (Journal of Statistical Software) R 编译后得到的结果,这是他模板原始的样子,如果想调整页面行间距,字体颜色等,请见下次推文(公众号:庄闪闪的R语言手册),我将会把这些小细节进行汇总。 ? 方法一 --- title: "Rmarkdown入门教程" author: "庄闪闪的R语言手册" date: "2/18/2021" output: rmdformats::readthedown 4 tufte包 --- title: "Rmarkdown入门教程" author: "庄闪闪的R语言手册" date: "2/18/2021" output: tufte::tufte_html 5 cerulean包 --- title: "Rmarkdown入门教程" author: "庄闪闪的R语言手册" date: "2/18/2021" output: html_document:

    1.8K30发布于 2021-04-08
  • 来自专栏R学习之路

    Day4——R 基础

    R RStudio安装与基础设置 ! 要点:用户名不可为中文 直接百度R 和 RStudio 选择版本安装 R编程语言 RStudio 开发环境 设置字体大小 Tools--Globbal Options--Appearance 小尝试 图片 图片 一些R的基本操作 设置Rproject管理工作目录 File----New Directory--New Project-填名字、路径 最好使用这种方法,便于工作常见小函数设置工作目录setwd

    33900编辑于 2023-10-24
  • 来自专栏python全栈教程专栏

    爬虫学习(4):error异常处理

    首先要导入request模块,还有异常处理模块error.用try和except搭配,如果能正常访问呢,就正常执行,不能正常执行就打印出出错的原因(reason)和状态码(code)以及请求头(headers).关键字参数sep是实现分隔符,比如多个参数输出时想要输出中间的分隔字符,这里就是打印里的每一个都对应一个换行,看结果图就知道了。 上面我们用到HTTPError,他是URLError的子类,现在我把子类和父类加进来:

    44730发布于 2021-10-18
  • 来自专栏python3

    Python爬虫笔记4-Beautif

    pip3 install beautifulsoup4 测试 python终端里导入beautifulsoup,无报错信息即安装成功。 >>from bs4 import BeautifulSoup >> BeautifulSoup对象 BeautifulSoup将复杂的HTML文档转换成一个复杂的树形结构,每个节点都是Python对象 ,所有对象可以归纳为4种: Tag NavigableString BeautifulSoup Comment BeautifulSoup 对象表示的是一个文档的内容。 获取Tags # 导入模块 from bs4 import BeautifulSoup html = """ <html><head><title>The Dormouse's story</title story

    The Dormouse's story 关于BeautifulSoup的使用就这样吧,常用个人就觉得用好find_all即可(=.=~) 参考链接 崔庆才 [Python3网络爬虫开发实战

    1K40发布于 2020-01-03
  • 来自专栏全栈程序员必看

    python爬虫4个实例

    文章目录 1、京东商品页面的爬取 2、亚马逊商品页面的爬取 可以先看 网络爬虫基础知识,然后结合下面的实例学习爬虫的常用方法。 ,但是并没有爬取到商品信息,因此我们联想到可能是亚马逊限制了我们的爬虫访问。 限制网络爬虫的方法: 来源审查: 检查来访HTTP协议头的User – Agent域,只响应浏览器或友好爬虫的访问。 发布公告: Robots协议,告知所有爬虫网站的爬取策略,要求爬虫遵守。 :50,startTimer:function(){a.ts++;setInterval(function(){d.ue&&a.pec<a.ec&&d.uex("at");a.pec=a.ec},1E4) Process finished with exit code 0 可见,更改User-Agent属性之后的爬虫可以正常爬取信息。

    85120编辑于 2022-08-24
  • 来自专栏机器学习AI算法工程

    python爬虫+R数据可视化 实例

    Python 和 r语言这对黄金搭档,在数据获取,分析和可视化展示方面,各具特色,相互配合,当之无愧成为数据分析领域的两把利剑。 该项目分为两个模块: 1,数据准备阶段 采用python网络爬虫,实现所需数据的抓取; 2,数据处理和数据可视化,采用r语言作为分析工具并作可视化展示。 login_url = post_url 以下即可采用正则表达式,提取 今日发帖数,会员人数,在线人数 代码如下: #正则获取列表页 user_num,topic_num,online_num 这种广度搜索爬虫都会涉及到需要补全链接的坑 第二,数据处理和数据可视化 主要采用r语言读取数据,进行频数统计和图表展示 简单贴几段代码: 读取剪切板数据 并采用table()函数求频数 data3<-read.table("clipboard r语言版 ?

    1.9K40发布于 2018-03-14
  • 来自专栏深度学习之tensorflow实战篇

    网页爬虫-R语言实现基本函数

    #*************网页爬虫-R语言实现,函数库文件*******# #****作者:H***************************************# #****版本:v0.1 spm=567.116925.155171.105.9ZYYMX&cat=50072693&isprepay=1&viewIndex=1&yp4p_page=0&commend=all&atype=b& cat=50072693&isprepay=1&user_type=0&as=0&viewIndex=1&yp4p_page=0&commend=all&atype=b&style=grid&olu=yes

    80140发布于 2019-02-14
领券