想象一下,你必须创建一个模型来向涉众解释,例如预测价格、重量、销售额等。在可解释性和可间性方面,哪种回归模型提供的效果最好?哪种型号最适合这个?
发布于 2021-02-05 17:21:40
我认为线性(通过模型的系数/权重)和基于树的模型(增益的重要性)是最好的可解释性。
但这并不局限于那些模型,因为你可以使用模型不可知论的技术来解释任何模型,甚至那些被认为是“黑匣子”的模型。
比如:
您可以查看这个好的资源来了解更多信息。
您不能忘记,模型可解释性的一个重要部分是模型性能。有一个易于解释的模型是没有意义的,但由于该模型发现的那些结构并不具有很好的通用性,所以它的性能不佳。因此,一个合适的模型版本将引导您在解释它时得出“正确”的结论。
发布于 2022-04-09 18:43:20
对于这个场景,我将保证符号回归(https://en.wikipedia.org/wiki/Symbolic_regression#:~:text=Symbolic%20Regression%20(SR)%20is%20a,启动%20点%20到%20%20算法。 ),它允许您将人类可解释的数学方程演化为一个总体。然后,您可以选择一个在性能和可解释性之间进行最佳权衡的模型。
有一些商业软件包可用于此,如DataModeler (https://evolved-analytics.com/),它允许您进化模型的总体,您可以探索Pareto前沿,它为您提供了在简单性(可解释性)和准确性之间的最佳折衷,您可以选择哪一个最适合您的需求。DataModeler还有其他特性,可以让您进一步探索模型以确定变量的重要性等,这些特性可以帮助您向涉众解释模型。
还有Eureqa (https://www.datarobot.com/nutonian/),它是最近被Nutoni人买下的,但是我对这个实现不太熟悉,因为它已经打包成DataRobot,作为许多不同的特性之一。
在前面链接的符号回归维基百科页面上提到了一些开源实现,但我还不太熟悉这些实现对用户有多友好。
https://datascience.stackexchange.com/questions/88992
复制相似问题