搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏Hank’s Blog
3-3 数据框的子集
> x <- data.frame(v1=1:5,v2=6:10,v3=11:15) > x v1 v2 v3 1 1 6 11 2 2 7 12 3 3 8 13 4 4 9 14 5 5 10 15 > x$v3[c(2,4)] <- NA > x v1 v2 v3 1 1 6 11 2 2 7 NA 3 3 8 13 4 4 9 NA 5 5 10 15 > #找出第2列 > x[,2] [1] 6 7 8 9 10 > x[,"v2"] [1] 6 7 8 9 10 > x[
77500发布于 2020-09-16
来自专栏python3
3-3 SQL Server 2005数
3-3 SQL Server 2005数据库优化了解数据库引擎优化顾问基本内容掌握数据库引擎优化顾问的使用掌握通过命令行的方式进行索引的优化——DTA 一个数据库系统的性能依赖于组成这些系统的数据库中物理设计结构的有效配置
81120发布于 2020-01-07
来自专栏叽叽西
lagou 爪哇 3-3 dubbo 笔记
Apache Dubbo是一款高性能的 Java RPC 框架。其前身是阿里巴巴公司开源的一个高性能、轻量级的开源 Java RPC框架，可以和 Spring 框架无缝集成。
60310编辑于 2022-05-17
来自专栏python3
Python-爬虫03：urllib.r
浏览器就是互联网世界上公认被允许的身份，如果我们希望我们的爬虫程序更像一个真实用户，那我们第一步就是需要伪装成一个被浏览器。
85120发布于 2020-01-19
来自专栏悟道
3-3欧几里得求最大公因子
最大公因子，指两个或多个整数共有约数中最大的一个 private static int gc(int a, int b) { if(b==0){ return a; } if(a<b){ int temp=a; a=b; b=temp; } return gc(b,a%b); }
50420发布于 2021-03-16
来自专栏机器学习养成记
R语言爬虫与文本分析
之前用python做过简单的爬虫与分析，今天尝试一下用R完成相应的功能。首先用R爬取了《了不起的麦瑟尔夫人》豆瓣短评作为语料，然后进行了词云绘制、关键词提取的基本操作。代码实现 R语言中，有两种进行数据获取的方式。一种是RCurl包+XML包，过程与python中的urllib与bs4相似，先读取网页代码再对html代码进行解析。用wordcloud2绘制词云的方法在十九大讲话文本分析（R语言）中也有介绍，本次我们用自定义图片的方式设置词云形状，即设置figPath参数，注意，图片需要存放在wordcloud2中默认的文件夹下，
2.3K140发布于 2018-04-10
来自专栏python3
34补3-3 rhcs集群基础应用
[root@node1 ~]# ansible ha -m shell -a 'service NetworkManager stop'
92700发布于 2020-01-15
来自专栏机器学习AI算法工程
python爬虫+R数据可视化实例
Python 和 r语言这对黄金搭档，在数据获取，分析和可视化展示方面，各具特色，相互配合，当之无愧成为数据分析领域的两把利剑。该项目分为两个模块： 1，数据准备阶段采用python网络爬虫，实现所需数据的抓取； 2，数据处理和数据可视化，采用r语言作为分析工具并作可视化展示。 login_url = post_url 以下即可采用正则表达式，提取今日发帖数，会员人数，在线人数代码如下： #正则获取列表页 user_num,topic_num,online_num 这种广度搜索爬虫都会涉及到需要补全链接的坑第二，数据处理和数据可视化主要采用r语言读取数据，进行频数统计和图表展示简单贴几段代码：读取剪切板数据并采用table()函数求频数 data3<-read.table("clipboard r语言版 ?
1.9K40发布于 2018-03-14
来自专栏菜鸟学数据分析之R语言
【R语言】文本挖掘| 网页爬虫新闻内容
图4 网页爬虫结果
2K10发布于 2021-01-28
来自专栏深度学习之tensorflow实战篇
网页爬虫-R语言实现基本函数
#*************网页爬虫-R语言实现，函数库文件*******# #****作者：H***************************************# #****版本：v0.1
80240发布于 2019-02-14
来自专栏AI机器学习与深度学习算法
机器学习入门 3-3 NumPy数据基础
本系列是《玩转机器学习教程》一个整理的视频笔记。本小节主要介绍NumPy模块的一些基础知识。
89400发布于 2019-11-13
来自专栏深度学习之tensorflow实战篇
网页爬虫-R语言实现基本函数
#*************网页爬虫-R语言实现，函数库文件*******# #****作者：H***************************************# #****版本：v0.1
95270发布于 2018-03-16
来自专栏R语言交流中心
R语言网络爬虫之Pubmed API的使用
今天我来给大家介绍一下Pubmed API是如何在R语言中运用自如的。 1. 我们需要安装R语言实现网络爬虫的两个关键包： XML，RCurl。安装R包大家都熟悉了： install.packages('XML'); install.packages('RCurl'); 或者你如果觉得写代码麻烦，你也可以通过R语言菜单实现： ? 2. R包安装成功后，在进行网络爬虫时需要加载这两个包：XML，RCurl。 R代码： library(XML) library(RCurl) 完成R包的加载。 3. R语言调用Pubmed API代码实例（获取基因SI和cancer相关的文献）： path='https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi
7K40发布于 2019-07-31
来自专栏小徐学爬虫
告别低效：构建健壮R爬虫的工程思维
这些教训让我明白，熟练不等于精通，R爬虫的艺术不在于写出能跑的代码，而在于构建健壮、高效且礼貌的工程。今天，我想分享这些用教训换来的经验，希望你无需重蹈我的覆辙。 R语言爬虫老手，尤其是在从其他语言（如Python）转过来，或者习惯了小规模、一次性脚本的数据分析师，常常会陷入一些特定的思维定式和误区。这些误区会导致代码脆弱、效率低下，甚至引发法律风险。以下是一些R语言爬虫老手都会犯的误区及其详细的解决方案：误区一：过度依赖 rvest + SelectorGadget 的“万能”组合表现：认为所有网站都可以用 rvest::html_nodes() 根源：低估了反爬虫机制的敏感性。默认的R User-Agent（例如 libcurl/... 或 r-curl/...）非常显眼。解决方案：模拟真实浏览器：总是设置合理的HTTP请求头。回顾这些坎坷，我的核心领悟是：强大的R爬虫绝非一堆函数调用，而是一个精心设计的系统。它需要我用侦探的眼光去发现隐藏API，用工程师的思维去处理错误与重试，用外交官的姿态去管理会话与延迟。
22710编辑于 2025-09-08
来自专栏机器学习AI算法工程
R语言爬虫初尝试-基于RVEST包学习
在学完coursera的getting and Cleaning data后，继续学习用R弄爬虫网络爬虫。主要用的还是Hadley Wickham开发的rvest包。再次给这位矜矜业业开发各种好用的R包的大神奉上膝盖。。。言归正传，拿了几个网页练手。包括对拉勾网爬了一下虫，还尝试了对国外某黄页爬虫，对ebay用户评价爬虫分析其卖家卖的东西主要在哪个价格段（我查的那个卖家，卖8.99和39.99最多，鞋子类），做了一下文本挖掘，还有爬了一下股票数据，不过这个研究让我深刻体会到了爬虫的有效性！好玩！实用！受张丹老师的两条均线与R语言)鼓舞好大！我觉得学R嘛，用到实处才是重要的！玩爬虫玩的太开心都没跟JHU的课了。。。。以后可以尝试按照自己和老爸的看股票习惯开发出类似的选股模型来~~
1.9K30发布于 2018-03-12
来自专栏小徐学爬虫
R语言初学者爬虫简单模板
习惯使用python做爬虫的，反过来使用R语言可能有点不太习惯，正常来说R语言好不好学完全取决于你的学习背景以及任务复杂情况。对于入门学者来说，R语言使用rvest+httr组合，几行代码就能完成简单爬取（比Python的Scrapy简单得多），R语言数据处理优势明显，爬取后可直接用dplyr/tidyr清洗，小打小闹用R语言完全没问题以下是一个适合初学者的R语言爬虫通用模板，使用rvest和httr包实现。 (Windows NT 10.0; Win64; x64; rv:107.0) Gecko/20100101 Firefox/107.0")# ======================# 核心爬虫函数，常见的还是python爬虫，因为起特性可能经常遇到一些问题，例如：乱码问题、动态内容、登录验证、分页爬取，分别总结了对应的处理方法，如有更多问题可以留言咨询我。
26810编辑于 2025-07-03
来自专栏小徐学爬虫
R语言爬虫程序自动爬取图片并下载
R语言本身并不适合用来爬取数据，它更适合进行统计分析和数据可视化。而Python的requests，BeautifulSoup，Scrapy等库则更适合用来爬取网页数据。如果你想要在R中获取网页内容，你可以使用rvest包。另外，使用爬虫ip是爬虫的常见做法，以避免被目标网站封IP。在Python中，你可以使用requests.get(url, proxies={‘duoip_proxy_host:your_proxy_port’})来设置爬虫ip。在R中，我不清楚是否可以直接设置爬虫ip，但你可以在requests库的文档中查找相关信息。
46110编辑于 2023-11-14
来自专栏coding for love
3-3 使用loader打包静态资源（样式篇上）
在制作网页时，我们必不可少地会使用css。那么webpack是如何打包css文件的呢？
1.1K20发布于 2019-06-17
来自专栏cwl_Java
C++编程之美-结构之法(代码清单3-3)
代码清单3-3 for(answer[0] = 0; answer[0] < total[number[0]]; answer[0]++) for(answer[1] = 0; answer
20120编辑于 2022-11-30
来自专栏python3
3-3 File类的常用操作的静态方法练
文本文件是我们接触频繁的一类文件，记事本程序经常操作的文件就是文本文件，很多应用程序会保存一些记录到日志文件里，这种日志文件也可以是文本文件。通过本小节的学习，可以掌握对文本文件的简单读写方法。
80320发布于 2020-01-14

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

3-3 数据框的子集

3-3 SQL Server 2005数

lagou 爪哇 3-3 dubbo 笔记

Python-爬虫03：urllib.r

3-3欧几里得求最大公因子

R语言爬虫与文本分析

34补3-3 rhcs集群基础应用

python爬虫+R数据可视化实例

【R语言】文本挖掘| 网页爬虫新闻内容

网页爬虫-R语言实现基本函数

机器学习入门 3-3 NumPy数据基础

网页爬虫-R语言实现基本函数

R语言网络爬虫之Pubmed API的使用

告别低效：构建健壮R爬虫的工程思维

R语言爬虫初尝试-基于RVEST包学习

R语言初学者爬虫简单模板

R语言爬虫程序自动爬取图片并下载

3-3 使用loader打包静态资源（样式篇上）

C++编程之美-结构之法(代码清单3-3)

3-3 File类的常用操作的静态方法练

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

3-3 数据框的子集

3-3 SQL Server 2005数

lagou 爪哇 3-3 dubbo 笔记

Python-爬虫03：urllib.r

3-3欧几里得求最大公因子

R语言爬虫与文本分析

34补3-3 rhcs集群基础应用

python爬虫+R数据可视化 实例

【R语言】文本挖掘| 网页爬虫新闻内容

网页爬虫-R语言实现基本函数

机器学习入门 3-3 NumPy数据基础

网页爬虫-R语言实现基本函数

R语言网络爬虫之Pubmed API的使用

告别低效：构建健壮R爬虫的工程思维

R语言爬虫初尝试-基于RVEST包学习

R语言初学者爬虫简单模板

R语言爬虫程序自动爬取图片并下载

3-3 使用loader打包静态资源（样式篇上）

C++编程之美-结构之法(代码清单3-3)

3-3 File类的常用操作的静态方法练

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

python爬虫+R数据可视化实例