文章/答案/技术大牛

发布

社区首页 >问答首页 >如何从列表中删除特定字符并将其保存为数据帧？

问如何从列表中删除特定字符并将其保存为数据帧？
EN

Stack Overflow用户

提问于 2019-02-05 19:33:47

回答 1查看 44关注 0票数 0

我想

获得一个干净的数据集
没有特殊字符
只有用实际的话
没有数字
它来自一个JSON文件

。

 library(rvest); library(XML); library(dplyr);library(tidyr); library(purrr); library(rjson)

 url <- "http://suggestqueries.google.com/complete/search?client=chrome&q=Nike"
 nike_autocomplete <- read_html(url)

输出应该如下所示：

[1] "Nike" "nike air" "nike air max" "nike schuhe" "nike air force" "nike air max 97"
[7] "nike tn" "nike id" "nike air max 270" "nike vapormax" "nike pullover" "nike schweiz"   
[13] "nike 97" "nike off white" "nike air max plus" "nike winterschuhe" "nike schuhe damen" "nike huarache"  
[19] "nike shoes" "nike logo" "nike air max 90"

因此，在最后没有空的东西。

list

dataframe

text

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-02-05 21:28:29

您要提取的文本是JSON格式的，所以使用json读取实用程序比使用regex要好得多。为此，我喜欢jsonlite::fromJSON。

library(rvest)
library(jsonlite)
library(purrr)

url <- "http://suggestqueries.google.com/complete/search?client=chrome&q=Nike"
read_html(url) %>%
  xml_text %>%
  fromJSON() %>%
  extract(1:2) %>%
  unlist
#  [1] "Nike"                  "nike shox"             "nike shoes"            "nike air max"         
#  [5] "nike outlet"           "nike air force 1"      "nike basketball shoes" "nike vapormax"        
#  [9] "nike air max 97"       "nike id"               "nike store"            "nike stock"           
# [13] "nike air max 270"      "nike promo code"       "nike windbreaker"      "nike sweatshirts"     
# [17] "nike huarache"         "nike hoodie"           "nike cortez"           "nike sweatpants"      
# [21] "nike slides"

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54541784

复制

相似问题

问如何从列表中删除特定字符并将其保存为数据帧？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从列表中删除特定字符并将其保存为数据帧？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从列表中删除特定字符并将其保存为数据帧？
EN