我不清楚EDA数据可视化提供了什么优势。我的优势是指我将根据一个或另一个形象做出什么样的决定。
有人能给我一个例子,说明数据可视化让我决定采用哪一种算法吗?
也就是说,在拟合任何模型之前,从“”一书中可以看到数据集是非常有用的。它可以让我们看到明显的模式和关系,并可能提出一种明智的分析形式。对于多元数据,找出正确的图样并不总是简单的,许多不同的方法已经被提出。

无论我是否看到了这种可视化,如何改变进行的方式?
发布于 2022-11-01 09:41:11
首先,可视化只是一种简单直观的方法来理解数据中的底层模式。通过这一点,你能实现的一切,也可以通过精心打印不同的价值观和统计数据来实现。
我将仅举两个简单的例子,说明由于数据中的模式而选择的算法。它们非常简单,但它们可以被概括。


这些是数据点本身的可视化,但其他可视化(如直方图)也可以帮助查找底层发行版。
此外,可视化在流程的其他部分也很有用。例如,如果您看到的是正态分布,您可以使用平均值来计算丢失的数据,而对于偏高的分布,中值则更合适。
发布于 2022-11-01 20:29:19
最简单的例子是Anscombe的四重奏

。这四个数据集是非常不同的,这并不是仅仅通过查看汇总统计数据就出现的。
https://datascience.stackexchange.com/questions/115759
复制相似问题