我们正在以RDD(String,String)的形式读取UTF_8中的一个文件,需要帮助将其转换为RDDString。
val textRdd = sparkSession.sparkContext.binaryFiles(filePath,12)
.mapValues(content => new String(content.toArray(), StandardCharsets.UTF_8))发布于 2021-08-13 13:06:12
你只需要从元组中提取值,即(string,string)。
val outRDD = textRdd.map(t=>t._2) // To get first value use t._1https://stackoverflow.com/questions/68772559
复制相似问题