如何删除由SparkR读取的CSV文件的前n行(头)。我知道Scala中有些东西是可能的,比如How do I convert csv file to rdd或http://qnalist.com/questions/4849107/skip-lines-in-spark,但是很难将它应用到SparkR中。
发布于 2016-03-16 08:08:14
我试着用这样的方法:
my_id <- createDataFrame(sqlContext, data.frame(my_id = 1:count(data)))
data.new <- merge(data, my_id)
data.filtered <- filter(data.new, data.new$my_id > 4)https://stackoverflow.com/questions/36019673
复制相似问题