问SparkR拖放多行头
EN

Stack Overflow用户

提问于 2016-03-15 18:49:56

回答 1查看 59关注 0票数 0

如何删除由SparkR读取的CSV文件的前n行(头)。我知道Scala中有些东西是可能的，比如How do I convert csv file to rdd或http://qnalist.com/questions/4849107/skip-lines-in-spark，但是很难将它应用到SparkR中。

apache-spark

header

sparkr

csv

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-16 08:08:14

我试着用这样的方法：

my_id <- createDataFrame(sqlContext, data.frame(my_id = 1:count(data)))
data.new <- merge(data, my_id)
data.filtered <- filter(data.new, data.new$my_id > 4)

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36019673

复制

相似问题

问SparkR拖放多行头
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问SparkR拖放多行头EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问SparkR拖放多行头
EN