我可以看到这两种方式,但似乎大多数情况下,它是在建模之前完成的。据我所知,EDA的目的是提供一些见解,可以帮助建立模型。
我还可以理解在构建模型之后(在迭代过程中)这样做,在迭代过程中,您可以使用任何EDA来构建初始模型,然后使用EDA来改进最初构建的模型。
你们觉得怎么样?
发布于 2021-04-23 21:44:16
以前做EDA总是有帮助的。它有助于创建一个更好的模型。假设您有一个图像数据集,并且通过查看它包含的各种大小和它包含的各种类型的图像来执行EDA。它给了你一个概念,你将在网络中使用的图像有多大,以及你将使用哪种类型的增强。其他类型的数据也是如此。
如果您事后这样做,您会经历相同的过程,但您只是浪费了网络的第一次运行(您可以使用更快地获得解决方案的资源)。
先熟悉数据,然后耐心点,然后去做模特。
发布于 2021-04-24 01:41:10
那得看情况。如果您正在构建一个神经网络,您将受益于对错误进行EDA而不是原始数据,以查看您的神经网络没有捕获哪些模式。
EDA对于发现与目标相关的特性是很棒的,如果您有问题感,您可以构建复杂的特性并测试它们的相关性。神经网络摆脱了特征工程的需求,建立快速模型后进行误差分析可能更有利于模型流水线的细化。
https://datascience.stackexchange.com/questions/93458
复制相似问题