首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >您使用哪些工具来清除损坏的数据?

您使用哪些工具来清除损坏的数据?
EN

Data Science用户
提问于 2017-04-29 21:25:47
回答 2查看 184关注 0票数 0

客户经常发送中断数据进行分析。我花了很多时间清理数据或等待一个正确的数据集。你能推荐一个能处理最常见的卷曲的工具吗?(错误的引号)..。

EN

回答 2

Data Science用户

回答已采纳

发布于 2017-04-30 23:37:37

Weka已经内置了预处理技术,而且u可能需要检查强大的工具dataPreparator,因为它提供了多种技术,用于将预处理操作符的数据清理、转换和探索链接到流图(操作符树)中,并且可以通过用户友好的图形用户界面处理大量数据(因为数据集没有存储在计算机内存中)。

票数 0
EN

Data Science用户

发布于 2017-04-30 05:21:22

如果您知道您需要的数据的性质,如@Emre所建议的手动清理,您可以使用Apache或Pandas。利用Spark和Pandas的数据帧方面将帮助您以更方便的方式预处理数据。因为数据帧占了任何数据类型,所以很容易访问和清理所需的段。如果损坏的数据是重复的,您也可以使用几种Map技术来快速清除它。如果是大数据的话。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/18684

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档