我目前正在构建一个二进制分类器。
我的输入是32个时间步骤的序列。
输入的某些时间步骤是常量的(例如: t-0总是0,t-5总是9,等等)
将这些时间步骤作为特性添加到模型中是否有意义?我认为这并不是因为:模型必须注意这些特性,它们会在模型中添加一种噪声/偏差--因为没有任何新的信息可以从它们中获得。我想得对吗?
发布于 2020-09-18 09:14:32
你在想这件事是正确的。如果数据在您的结果之间没有变化,那么它就不需要包括在内。
尽管如此,如果您使用时间序列技术(如趋势分解 )来进行功能工程,那么更改数据的结构可能会使解释复杂化(即:如果删除了数据点,什么是移动平均值?)
有鉴于此,我想说的是,您不应该将这些怪癖构建到您编写的代码中,并且应该尽可能保持它的一般性,除非是绝对必要的。这与编写不重复自己的“干”码的概念有关。
个人观点:分类器,如软件,应尽量不对数据作出假设。这使您能够更好地重用或共享它。
https://datascience.stackexchange.com/questions/81875
相似问题