数据使用自动清洗工具吗?
我的意思是类似于h2o.ai的自动ml函数,但用于预处理数据。或者你总是“用手”清理数据。
发布于 2018-12-02 22:50:02
清洁数据在不同的数据之间有很大差异。考虑到您主要讨论的是非结构化数据,它可以分为两种类型,即图像数据和文本数据。清理这两个数据的过程取决于使用这些数据所需达到的目标类型。一个简短的过程可以解释如下:
通常,为这些过程设计的函数被输入到管道中,因此每个条目都不需要以类似的方式处理。
我建议你读一些论文和博客:实现病人数据自动清洗,将凌乱的数据转化为Tidy数据
https://datascience.stackexchange.com/questions/41984
复制相似问题