目前正在尝试编写代码,以检查数据质量为7GB的数据文件。我试着用谷歌搜索,但没有结果。最初,代码的目的是检查有多少是nulls/NaNs,然后将其与另一个数据文件连接起来,并比较每个文件之间的质量。我们期待第二个是更可靠的,但我想稍后自动化整个过程。我想知道这里是否有人愿意使用Dask共享他们的数据质量python代码。谢谢
发布于 2022-02-21 13:41:33
我建议采取以下办法:
https://stackoverflow.com/questions/71203005
复制相似问题