使用Accord.net (http://accord-framework.net/docs/html/T_Accord_Statistics_Analysis_LogisticRegressionAnalysis.htm)进行逻辑回归大约需要5分钟的计算时间。SAS可以在几秒钟内完成(也可以使用单CPU内核)。
数据集大约有40000行和30个输入。
为什么会有这样的差异呢?SAS是否使用复杂度更高的算法?据我所知,逻辑回归是一种非常简单的算法。
有没有其他库可以做得更好(最好是免费的)?
发布于 2014-08-29 12:38:55
解决方案是注释掉这一行:
它计算一些我不需要的非常昂贵的统计数据。
有一个类可以与标准的Accord包一起使用:https://gist.github.com/eugenem/e1dd2ef2149e8c21c37d
发布于 2014-08-28 23:09:16
我也有过多项logistic回归的经验。我对Accord、R、SPSS和Python的Scikit进行了比较。我有30个输入,10个输出和1600+训练示例。Accord花了8分钟,其余的花了2-8瑞典克朗。Accord看起来很漂亮,但对于多项式逻辑回归来说,它的速度会变慢。我的解决方案是我做了一个小的python webservice,它计算回归并将结果保存在数据库中。
https://stackoverflow.com/questions/25103306
复制相似问题