首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >dropDuplicates in SparkR

dropDuplicates in SparkR
EN

Stack Overflow用户
提问于 2016-05-02 04:53:31
回答 1查看 298关注 0票数 1

SparkR是否包含dropDuplicates函数(根据特定列删除重复行)?

我在SOF中遇到了这个回答。但是,我们没有使用GroupBy,而是在SparkR中有一个dropDuplicates函数吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-05-02 07:42:12

要做到这一点,所有的列,它是不同的

代码语言:javascript
复制
distinct(x)

代码语言:javascript
复制
unique(x)

要做到这一点,“基于特定的列”,正如您所说的,您最好的选择是GroupBy,因为星火无法决定保存哪一条“不完全不同”的记录。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36975200

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档