我对caret和e1071包的相对优势没有发现太多的讨论,令人惊讶的是。据我理解,这些包执行许多相同的ML算法。考虑到这一点,我感兴趣的是那些在这两方面都有经验的从业者认为这些软件包的优点和弱点是什么。你对代码的可读性、编码的易用性、方法、速度等有何看法?
特别是我对多类支持向量机感兴趣
发布于 2016-02-21 18:36:25
我认为caret和e1071有不同的用途。首先让我们讨论一下caret,它最接近的竞争对手是mlr包。这两个包都是元包,允许跨参数优化模型。举一个问题,你不确定你是想要使用拉索或岭创建一个模型。正如所解释的,这里 caret允许根据不同类型的交叉验证来选择最优的lambda。
相反,e1071包是由TU开发的一个功能包。它可能是caret使用的最流行的支持向量机包之一。但是它的目标与caret有很大的不同,它实现了学习算法和其他函数,而caret则寻求学习模型中的最佳参数。
发布于 2016-02-26 01:07:23
那得看情况。
所有的教授(在我的大学)都会用e1071向学生展示例子。e1071这个有点奇怪的名字来自于一个课程名称。
但是,如果您有业界或kaggle方面的经验,您会发现caret的预处理功能非常有用。通过几个参数指定您想要的内容。您可以获得标准化、填充NAs、交叉验证等,非常容易。一点也不头痛。
如果时间允许,两者都玩。
https://datascience.stackexchange.com/questions/10333
复制相似问题