搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Hank’s Blog
2-4 R语言基础列表
> l1 <- list("a",2,10L,3+4i,TRUE) #每个元素没有名字 > l1 [[1]] [1] "a"
53120发布于 2020-09-16
来自专栏悟道
2-4 快速乘法模板
适用于不让用/ * 的情况实现某些结果 ! /** * 快速乘法 * * @param a 乘数 * @param b 被乘数 * @return 积 */ public static long quickMulti(long a, long b) { long result = 0; while (b > 0) { if ((b & 1) == 1) {
49110发布于 2021-06-01
来自专栏刷题笔记
2-4 另类堆栈 (20 分)
本文链接：https://blog.csdn.net/shiliang97/article/details/101049523 2-4 另类堆栈 (20 分) 在栈的顺序存储实现中，另有一种方法是将Top
77630发布于 2019-11-08
来自专栏Deep learning进阶路
2-4 线性表之双链表
2-4 线性表之双链表双向链表除了相当于在单链表的基础上，每个结点多了一个指针域prior，用于存储其直接前驱的地址。同时保留有next，用于存储其直接后继的地址。 ?
54920发布于 2019-07-02
来自专栏python3
Python-爬虫03：urllib.r
浏览器就是互联网世界上公认被允许的身份，如果我们希望我们的爬虫程序更像一个真实用户，那我们第一步就是需要伪装成一个被浏览器。
85120发布于 2020-01-19
来自专栏IT技术圈
练习2-4 温度转换 (5分)
%p 指针的值 %e 指数形式的浮点数 %x 无符号以十六进制表示的整数 %o 无符号以八进制表示的整数 %g 自动选择合适的表示法一些特殊规定字符：符号说明 \n 换行 \f 清屏并换页 \r
1.1K10发布于 2021-02-24
来自专栏机器学习养成记
R语言爬虫与文本分析
之前用python做过简单的爬虫与分析，今天尝试一下用R完成相应的功能。首先用R爬取了《了不起的麦瑟尔夫人》豆瓣短评作为语料，然后进行了词云绘制、关键词提取的基本操作。代码实现 R语言中，有两种进行数据获取的方式。一种是RCurl包+XML包，过程与python中的urllib与bs4相似，先读取网页代码再对html代码进行解析。用wordcloud2绘制词云的方法在十九大讲话文本分析（R语言）中也有介绍，本次我们用自定义图片的方式设置词云形状，即设置figPath参数，注意，图片需要存放在wordcloud2中默认的文件夹下，
2.3K140发布于 2018-04-10
来自专栏机器学习AI算法工程
python爬虫+R数据可视化实例
Python 和 r语言这对黄金搭档，在数据获取，分析和可视化展示方面，各具特色，相互配合，当之无愧成为数据分析领域的两把利剑。该项目分为两个模块： 1，数据准备阶段采用python网络爬虫，实现所需数据的抓取； 2，数据处理和数据可视化，采用r语言作为分析工具并作可视化展示。 login_url = post_url 以下即可采用正则表达式，提取今日发帖数，会员人数，在线人数代码如下： #正则获取列表页 user_num,topic_num,online_num 这种广度搜索爬虫都会涉及到需要补全链接的坑第二，数据处理和数据可视化主要采用r语言读取数据，进行频数统计和图表展示简单贴几段代码：读取剪切板数据并采用table()函数求频数 data3<-read.table("clipboard r语言版 ?
1.9K40发布于 2018-03-14
来自专栏深度学习之tensorflow实战篇
网页爬虫-R语言实现基本函数
#*************网页爬虫-R语言实现，函数库文件*******# #****作者：H***************************************# #****版本：v0.1
80240发布于 2019-02-14
来自专栏菜鸟学数据分析之R语言
【R语言】文本挖掘| 网页爬虫新闻内容
图4 网页爬虫结果
2K10发布于 2021-01-28
来自专栏深度学习之tensorflow实战篇
网页爬虫-R语言实现基本函数
#*************网页爬虫-R语言实现，函数库文件*******# #****作者：H***************************************# #****版本：v0.1
95070发布于 2018-03-16
来自专栏coding for love
2-4 使用webpack的配置文件
之所以直接执行npx webpack index.js就能打包成功，是由于webpack内置了配置文件。尝试直接运行npx webpack会报错，因为webpack不知道打包的入口文件是啥。但其实一个项目的入口文件是极少有变动的，每次都写很麻烦。有没有什么办法呢？
72440发布于 2019-05-21
来自专栏小徐学爬虫
告别低效：构建健壮R爬虫的工程思维
这些教训让我明白，熟练不等于精通，R爬虫的艺术不在于写出能跑的代码，而在于构建健壮、高效且礼貌的工程。今天，我想分享这些用教训换来的经验，希望你无需重蹈我的覆辙。 R语言爬虫老手，尤其是在从其他语言（如Python）转过来，或者习惯了小规模、一次性脚本的数据分析师，常常会陷入一些特定的思维定式和误区。这些误区会导致代码脆弱、效率低下，甚至引发法律风险。以下是一些R语言爬虫老手都会犯的误区及其详细的解决方案：误区一：过度依赖 rvest + SelectorGadget 的“万能”组合表现：认为所有网站都可以用 rvest::html_nodes() 根源：低估了反爬虫机制的敏感性。默认的R User-Agent（例如 libcurl/... 或 r-curl/...）非常显眼。解决方案：模拟真实浏览器：总是设置合理的HTTP请求头。回顾这些坎坷，我的核心领悟是：强大的R爬虫绝非一堆函数调用，而是一个精心设计的系统。它需要我用侦探的眼光去发现隐藏API，用工程师的思维去处理错误与重试，用外交官的姿态去管理会话与延迟。
22510编辑于 2025-09-08
来自专栏R语言交流中心
R语言网络爬虫之Pubmed API的使用
今天我来给大家介绍一下Pubmed API是如何在R语言中运用自如的。 1. 我们需要安装R语言实现网络爬虫的两个关键包： XML，RCurl。安装R包大家都熟悉了： install.packages('XML'); install.packages('RCurl'); 或者你如果觉得写代码麻烦，你也可以通过R语言菜单实现： ? 2. R包安装成功后，在进行网络爬虫时需要加载这两个包：XML，RCurl。 R代码： library(XML) library(RCurl) 完成R包的加载。 3. R语言调用Pubmed API代码实例（获取基因SI和cancer相关的文献）： path='https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi
7K40发布于 2019-07-31
来自专栏机器学习AI算法工程
R语言爬虫初尝试-基于RVEST包学习
在学完coursera的getting and Cleaning data后，继续学习用R弄爬虫网络爬虫。主要用的还是Hadley Wickham开发的rvest包。再次给这位矜矜业业开发各种好用的R包的大神奉上膝盖。。。言归正传，拿了几个网页练手。包括对拉勾网爬了一下虫，还尝试了对国外某黄页爬虫，对ebay用户评价爬虫分析其卖家卖的东西主要在哪个价格段（我查的那个卖家，卖8.99和39.99最多，鞋子类），做了一下文本挖掘，还有爬了一下股票数据，不过这个研究让我深刻体会到了爬虫的有效性！好玩！实用！受张丹老师的两条均线与R语言)鼓舞好大！我觉得学R嘛，用到实处才是重要的！玩爬虫玩的太开心都没跟JHU的课了。。。。以后可以尝试按照自己和老爸的看股票习惯开发出类似的选股模型来~~
1.9K30发布于 2018-03-12
来自专栏小徐学爬虫
R语言初学者爬虫简单模板
习惯使用python做爬虫的，反过来使用R语言可能有点不太习惯，正常来说R语言好不好学完全取决于你的学习背景以及任务复杂情况。对于入门学者来说，R语言使用rvest+httr组合，几行代码就能完成简单爬取（比Python的Scrapy简单得多），R语言数据处理优势明显，爬取后可直接用dplyr/tidyr清洗，小打小闹用R语言完全没问题以下是一个适合初学者的R语言爬虫通用模板，使用rvest和httr包实现。 (Windows NT 10.0; Win64; x64; rv:107.0) Gecko/20100101 Firefox/107.0")# ======================# 核心爬虫函数，常见的还是python爬虫，因为起特性可能经常遇到一些问题，例如：乱码问题、动态内容、登录验证、分页爬取，分别总结了对应的处理方法，如有更多问题可以留言咨询我。
26810编辑于 2025-07-03
来自专栏小徐学爬虫
R语言爬虫程序自动爬取图片并下载
R语言本身并不适合用来爬取数据，它更适合进行统计分析和数据可视化。而Python的requests，BeautifulSoup，Scrapy等库则更适合用来爬取网页数据。如果你想要在R中获取网页内容，你可以使用rvest包。另外，使用爬虫ip是爬虫的常见做法，以避免被目标网站封IP。在Python中，你可以使用requests.get(url, proxies={‘duoip_proxy_host:your_proxy_port’})来设置爬虫ip。在R中，我不清楚是否可以直接设置爬虫ip，但你可以在requests库的文档中查找相关信息。
46110编辑于 2023-11-14
来自专栏AI机器学习与深度学习算法
学习分类 2-4 感知机权重向量的更新
下面直接给出权重向量的更新表达式，然后通过可视化的方式来直观的展示权重向量的更新。
1.3K40编辑于 2022-11-08
来自专栏育种数据分析之放飞自我
笔记 | GWAS 操作流程2-4：哈温平衡检验
计算所有位点的HWE的P值 plink --bfile HapMap_3_r3_8 --hardy plink.hwe的数据格式： CHR 染色体 SNP SNP的ID TEST 类型 A1 minor 设定过滤标准1e-4 plink --bfile HapMap_3_r3_8 --hwe 1e-4 --make-bed --out HapMap_3_r3_9 日志： Options in effect : --bfile HapMap_3_r3_8 --hwe 1e-4 --make-bed --out HapMap_3_r3_9 515185 MB RAM detected; reserving --make-bed to HapMap_3_r3_9.bed + HapMap_3_r3_9.bim + HapMap_3_r3_9.fam ... done. 过滤后的结果文件 HapMap_3_r3_9.bed HapMap_3_r3_9.bim HapMap_3_r3_9.fam HapMap_3_r3_9.log
5.4K21发布于 2020-04-27
来自专栏刷题笔记
【并查集】2-4 朋友圈 (25 分)
2-4 朋友圈 (25 分) 某学校有N个学生，形成M个俱乐部。每个俱乐部里的学生有着一定相似的兴趣爱好，形成一个朋友圈。一个学生可以同时属于若干个不同的俱乐部。 =r) r= pre[r];//找到父亲 while(pre[x]! int r = x,t; while(pre[r]! =r) r= pre[r];//找到父亲 while(pre[x]! [r] ?
1K10发布于 2020-06-23

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

2-4 R语言基础列表

2-4 快速乘法模板

2-4 另类堆栈 (20 分)

2-4 线性表之双链表

Python-爬虫03：urllib.r

练习2-4 温度转换 (5分)

R语言爬虫与文本分析

python爬虫+R数据可视化实例

网页爬虫-R语言实现基本函数

【R语言】文本挖掘| 网页爬虫新闻内容

网页爬虫-R语言实现基本函数

2-4 使用webpack的配置文件

告别低效：构建健壮R爬虫的工程思维

R语言网络爬虫之Pubmed API的使用

R语言爬虫初尝试-基于RVEST包学习

R语言初学者爬虫简单模板

R语言爬虫程序自动爬取图片并下载

学习分类 2-4 感知机权重向量的更新

笔记 | GWAS 操作流程2-4：哈温平衡检验

【并查集】2-4 朋友圈 (25 分)

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

2-4 R语言基础 列表

2-4 快速乘法 模板

2-4 另类堆栈 (20 分)

2-4 线性表之双链表

Python-爬虫03：urllib.r

练习2-4 温度转换 (5分)

R语言爬虫与文本分析

python爬虫+R数据可视化 实例

网页爬虫-R语言实现基本函数

【R语言】文本挖掘| 网页爬虫新闻内容

网页爬虫-R语言实现基本函数

2-4 使用webpack的配置文件

告别低效：构建健壮R爬虫的工程思维

R语言网络爬虫之Pubmed API的使用

R语言爬虫初尝试-基于RVEST包学习

R语言初学者爬虫简单模板

R语言爬虫程序自动爬取图片并下载

学习分类 2-4 感知机权重向量的更新

笔记 | GWAS 操作流程2-4：哈温平衡检验

【并查集】2-4 朋友圈 (25 分)

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

2-4 R语言基础列表

2-4 快速乘法模板

python爬虫+R数据可视化实例