我想可视化一个EDA的数据集,它有8个参数和2个类标签。我搞不懂要选择哪些参数,依据是什么?另外,我是否想知道在可视化之前应用降维技术是否更好?
发布于 2019-07-02 13:52:15
法拉兹!因为您只有8个参数,所以观察所有参数以及它们是如何为两个类表示都是不费时的。
您可以从有关参数在两个类上的分布的简单信息开始。请查看记事本,其中一位作者探索了泰坦尼克号的数据。你可以用类似的方式开始解释。
要从一个社区获得更多的提示,你需要向我们提供更多的数据,比如你的数据集的大小,参数是分类的还是数字的,等等。实际上你的EDA的目的是什么?你下一步要做什么?
https://datascience.stackexchange.com/questions/54914
复制相似问题