文章/答案/技术大牛

发布

社区首页 >问答首页 >使用sparklyr软件包访问蜂箱？

问使用sparklyr软件包访问蜂箱？
EN

Stack Overflow用户

提问于 2017-04-07 08:45:10

回答 2查看 3.5K关注 0票数 1

library(sparklyr)
library(dplyr)
home <- "/usr/hdp/current/spark-client"
sc <- spark_connect(master = "yarn-client", spark_home = home, version = "1.6.2")
readFromSpark <- spark_read_csv(sc, name="test", path ="hdfs://hostname/user/test.csv",header=TRUE)

我已经成功地使用sparklyr访问了hdfs。但是如何使用sparklyr访问hive表/命令，因为我需要将这个df存储到hive中。

apache-spark

hive

sparklyr

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-05-31 13:49:03

AFAIK，sparklyr没有直接创建数据库/表的功能。但是您可以使用DBI创建数据库/表。

library(DBI)
iris_preview <- dbExecute(sc, "CREATE EXTERNAL TABLE...")

票数 4

Stack Overflow用户

发布于 2018-04-26 02:20:38

我就是这样做到这一点的：

设置：

cc <- RxSpark(nameNode = hdfs_host(myADL))
rxSetComputeContext(cc)

myXDFname <- 'something'
hivTbl <- RxHiveData(table = myXDFname)

sc <- spark_connect('yarn-client')

tbl_cache(sc, myXDFname)
mytbl <- tbl(sc, myXDFname)

现在用它做点什么

mytbl %>% head

mytbl %>% 
   filter(rlike(<txt col>, pattern)) %>%
   group_by(something) %>%
   tally() %>%
   collect() %>% #this is important
   ggplot(., aes(...)) %>%
   geom_triforce(...)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43273623

复制

相似问题

问使用sparklyr软件包访问蜂箱？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用sparklyr软件包访问蜂箱？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用sparklyr软件包访问蜂箱？
EN