首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >哪种数据科学模型最适合预测问题的可解释性?

哪种数据科学模型最适合预测问题的可解释性?
EN

Data Science用户
提问于 2021-02-05 17:06:04
回答 2查看 64关注 0票数 1

想象一下,你必须创建一个模型来向涉众解释,例如预测价格、重量、销售额等。在可解释性和可间性方面,哪种回归模型提供的效果最好?哪种型号最适合这个?

EN

回答 2

Data Science用户

发布于 2021-02-05 17:21:40

我认为线性(通过模型的系数/权重)和基于树的模型(增益的重要性)是最好的可解释性。

但这并不局限于那些模型,因为你可以使用模型不可知论的技术来解释任何模型,甚至那些被认为是“黑匣子”的模型。

比如:

  1. SHAP值
  2. 部分相依图
  3. 酸橙

您可以查看这个好的资源来了解更多信息。

您不能忘记,模型可解释性的一个重要部分是模型性能。有一个易于解释的模型是没有意义的,但由于该模型发现的那些结构并不具有很好的通用性,所以它的性能不佳。因此,一个合适的模型版本将引导您在解释它时得出“正确”的结论。

票数 1
EN

Data Science用户

发布于 2022-04-09 18:43:20

对于这个场景,我将保证符号回归(https://en.wikipedia.org/wiki/Symbolic_regression#:~:text=Symbolic%20Regression%20(SR)%20is%20a,启动%20点%20到%20%20算法。 ),它允许您将人类可解释的数学方程演化为一个总体。然后,您可以选择一个在性能和可解释性之间进行最佳权衡的模型。

有一些商业软件包可用于此,如DataModeler (https://evolved-analytics.com/),它允许您进化模型的总体,您可以探索Pareto前沿,它为您提供了在简单性(可解释性)和准确性之间的最佳折衷,您可以选择哪一个最适合您的需求。DataModeler还有其他特性,可以让您进一步探索模型以确定变量的重要性等,这些特性可以帮助您向涉众解释模型。

还有Eureqa (https://www.datarobot.com/nutonian/),它是最近被Nutoni人买下的,但是我对这个实现不太熟悉,因为它已经打包成DataRobot,作为许多不同的特性之一。

在前面链接的符号回归维基百科页面上提到了一些开源实现,但我还不太熟悉这些实现对用户有多友好。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/88992

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档