文章/答案/技术大牛

发布

社区首页 >问答首页 >我为什么要理解AI架构？

问我为什么要理解AI架构？
EN

Data Science用户

提问于 2021-11-07 13:20:46

回答 2查看 2.7K关注 0票数 10

为什么我要理解在某些人工智能架构的深处发生了什么呢？

例如，LSTM部分Conv.像这样的架构。当我能在互联网上找到任何模型或者在互联网上找到任何实现时，我为什么要理解正在发生什么呢？

bert

machine-learning

deep-learning

cnn

machine-learning-model

回答 2

Data Science用户

发布于 2021-11-07 20:18:32

您是对的，如果您只想应用架构，实际上不需要知道它们。

但是，理解这个体系结构是有原因的。

对于你的问题，模特儿们通常不会马上开始工作。在这种情况下，您必须调优模型参数等，以便将模型应用于您的问题。因此，对架构的了解对于调试是非常重要的。
如果您想在生产中使用该模型，您应该能够向业务人员解释它是如何工作的，当它可能失败时，它的局限性是什么。
如果你想开发新的方法，对目前的模型有一个坚实的理解是不可避免的。
如果您想要部署您没有正在运行的实现的系统。

票数 14

Data Science用户

发布于 2021-11-08 11:19:46

我知道你在找捷径。您可以阅读一个体系结构，并生成一个在性能基准上得分很高的实现。尽管表现让人觉得很有价值，但这并不能说明你做得很好，或者提供了一个高质量的模型。那么这些额外的斗争又有什么用呢？

目前流行的算法和体系结构正在发生变化。每个人都可以学习一个体系结构的优点和局限性的列表。理解底层技术的斗争是一个过程，它教会您如何评估体系结构--及其在特定环境中的使用--批判性的和半独立的*。从这个角度来看，你目前正在研究的架构只是一个教学工具。

知道架构有限制并不意味着您可以：

确认这个限制是否适用于您的用例。
了解限制的影响有多大。
如何测试或测量限制的范围。
或如何减轻或补偿限制。

所有这些都需要对体系结构的组件有一个扎实的理解。ProPublica对算法偏差(通过回车机)的报道是开发人员可能知道其算法局限性的一个很好的例子。如果你用有偏见的数据训练一个模式匹配算法，你就会得到一个同样偏倚的模型。这是众所周知的，这是怎么发生的？

这些模型的开发人员难道根本不知道这种风险吗？他们不在乎吗？或者，他们没有意识到这个限制对他们的用例意味着什么，以及如何减轻它？

*我做的是实施，而不是原创研究。但我需要能够阅读出版物，并理解它们的内容如何适用于我的用例--即使该技术从未在类似的环境中应用过。

票数 3

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/103904

复制

相似问题

问我为什么要理解AI架构？
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问我为什么要理解AI架构？EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问我为什么要理解AI架构？
EN