为什么我要理解在某些人工智能架构的深处发生了什么呢?
例如,LSTM部分Conv.像这样的架构。当我能在互联网上找到任何模型或者在互联网上找到任何实现时,我为什么要理解正在发生什么呢?
发布于 2021-11-07 20:18:32
您是对的,如果您只想应用架构,实际上不需要知道它们。
但是,理解这个体系结构是有原因的。
发布于 2021-11-08 11:19:46
我知道你在找捷径。您可以阅读一个体系结构,并生成一个在性能基准上得分很高的实现。尽管表现让人觉得很有价值,但这并不能说明你做得很好,或者提供了一个高质量的模型。那么这些额外的斗争又有什么用呢?
目前流行的算法和体系结构正在发生变化。每个人都可以学习一个体系结构的优点和局限性的列表。理解底层技术的斗争是一个过程,它教会您如何评估体系结构--及其在特定环境中的使用--批判性的和半独立的*。从这个角度来看,你目前正在研究的架构只是一个教学工具。
知道架构有限制并不意味着您可以:
所有这些都需要对体系结构的组件有一个扎实的理解。ProPublica对算法偏差(通过回车机)的报道是开发人员可能知道其算法局限性的一个很好的例子。如果你用有偏见的数据训练一个模式匹配算法,你就会得到一个同样偏倚的模型。这是众所周知的,这是怎么发生的?
这些模型的开发人员难道根本不知道这种风险吗?他们不在乎吗?或者,他们没有意识到这个限制对他们的用例意味着什么,以及如何减轻它?
*我做的是实施,而不是原创研究。但我需要能够阅读出版物,并理解它们的内容如何适用于我的用例--即使该技术从未在类似的环境中应用过。
https://datascience.stackexchange.com/questions/103904
复制相似问题