使用pandas分析生成报告。数据集的大小非常大,为了加快处理速度,我试图关闭相关性,所以我使用了另一篇文章中的check_correlations : ValueError: Config参数"check_correlation“不存在。这就是我使用这行代码时遇到的问题
a = prof.ProfileReport(df, title='Downloads', check_correlation=False)它会生成这个问题
ValueError:配置参数"check_correlation“不存在。
发布于 2019-10-10 16:52:57
由于他们已经更改了版本2上的配置,因此您可以将其用作:
import pandas_profiling
profile = df.profile_report(check_correlation_pearson=False,
correlations={'pearson': False,
'spearman': False,
'kendall': False,
'phi_k': False,
'cramers': False,
'recoded': False})关闭相关性。然而,它仍然没有1.4版那么快。您还可以研究其他配置here。
发布于 2020-08-27 08:47:59
这种方式对我不起作用,我使用:
A= prof.ProfileReport(df,title='Downloads',minimal=True)
发布于 2019-10-09 16:53:01
请在pandas-profiling项目中查看此issue。
https://stackoverflow.com/questions/58298848
复制相似问题