首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我为什么要理解AI架构?

我为什么要理解AI架构?
EN

Data Science用户
提问于 2021-11-07 13:20:46
回答 2查看 2.7K关注 0票数 10

为什么我要理解在某些人工智能架构的深处发生了什么呢?

例如,LSTM部分Conv.像这样的架构。当我能在互联网上找到任何模型或者在互联网上找到任何实现时,我为什么要理解正在发生什么呢?

EN

回答 2

Data Science用户

发布于 2021-11-07 20:18:32

您是对的,如果您只想应用架构,实际上不需要知道它们。

但是,理解这个体系结构是有原因的。

  • 对于你的问题,模特儿们通常不会马上开始工作。在这种情况下,您必须调优模型参数等,以便将模型应用于您的问题。因此,对架构的了解对于调试是非常重要的。
  • 如果您想在生产中使用该模型,您应该能够向业务人员解释它是如何工作的,当它可能失败时,它的局限性是什么。
  • 如果你想开发新的方法,对目前的模型有一个坚实的理解是不可避免的。
  • 如果您想要部署您没有正在运行的实现的系统。
票数 14
EN

Data Science用户

发布于 2021-11-08 11:19:46

我知道你在找捷径。您可以阅读一个体系结构,并生成一个在性能基准上得分很高的实现。尽管表现让人觉得很有价值,但这并不能说明你做得很好,或者提供了一个高质量的模型。那么这些额外的斗争又有什么用呢?

目前流行的算法和体系结构正在发生变化。每个人都可以学习一个体系结构的优点和局限性的列表。理解底层技术的斗争是一个过程,它教会您如何评估体系结构--及其在特定环境中的使用--批判性的和半独立的*。从这个角度来看,你目前正在研究的架构只是一个教学工具。

知道架构有限制并不意味着您可以:

  • 确认这个限制是否适用于您的用例。
  • 了解限制的影响有多大。
  • 如何测试或测量限制的范围。
  • 或如何减轻或补偿限制。

所有这些都需要对体系结构的组件有一个扎实的理解。ProPublica对算法偏差(通过回车机)的报道是开发人员可能知道其算法局限性的一个很好的例子。如果你用有偏见的数据训练一个模式匹配算法,你就会得到一个同样偏倚的模型。这是众所周知的,这是怎么发生的?

这些模型的开发人员难道根本不知道这种风险吗?他们不在乎吗?或者,他们没有意识到这个限制对他们的用例意味着什么,以及如何减轻它?

*我做的是实施,而不是原创研究。但我需要能够阅读出版物,并理解它们的内容如何适用于我的用例--即使该技术从未在类似的环境中应用过。

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/103904

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档