最近,我参加了一次PhD论文答辩,其中一名委员会成员声称,“手工特征提取已经过时。如今,我们有深度机器学习模型为我们自动完成这项工作。”
这句话是真的吗?如果是,请提供证明这一索赔的参考资料。
编辑:显然,根据数据类型,似乎有不同的答案。因此,请告诉我是否有任何参考资料证实了你们对图像、时间序列等的要求.分开。
发布于 2019-10-30 12:00:12
在一般情况下,这绝不是事实。让我们详细分析不同数据场景的情况:
然而,我认为深入学习领域的发展趋势(即大量可用数据)是试图设计出经过端到端培训的系统,并尽可能少地进行特殊处理。然而,很多时候,这是通过将专家知识以归纳偏差的形式注入网络来实现的。
发布于 2019-10-30 11:09:19
不,手工特征提取还没有过时。此外,手工特征提取是很难完成的,鉴于数据科学家需要业务和领域逻辑来构建一个健壮的模型来复制和捕捉数据中的趋势和模式。然而,也有一些例外,如图像数据。
取决于,如果它的图像数据,是的,该语句为真。有许多深度学习技术,如CNN,可以自动提取特征。但是,如果您的数据是结构(即标准表格式),则需要使用p_value、相关分析、chi检验和feature_selection模型(如PCA和降维)来选择特征。
下面列出了一系列特征提取技术(需要人工干预的i.e.manual特征提取技术;这些不是深度学习的提取技术,尽管是自动化的):
以下是深度学习特征提取技术的列表:
发布于 2019-10-30 12:09:15
DL方法的主要优点之一是它们可以从原始数据中工作,并且通常比具有精心构建的特性的传统方法表现得更好。因此,认为传统的特性工程已经过时是非常诱人的,因为它需要更多的工作,而且常常导致性能下降。
但是,在以这种方式丢弃特性工程之前,您应该小心:
https://datascience.stackexchange.com/questions/62409
复制相似问题