首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用哪种机器学习库?

使用哪种机器学习库?
EN

Stack Overflow用户
提问于 2010-05-26 17:32:41
回答 6查看 19.4K关注 0票数 33

我正在寻找一个库,理想情况下,它具有以下特性:

  • 实现多维数据的分层聚类(理想的方法是相似或距离矩阵)
  • 实现支持向量机
  • 在C++
  • 有一些文档(这个似乎是最难的)

我希望这是在C++,因为我最满意的语言,但我也会使用任何其他语言,如果它是值得的。我在谷歌上搜索并找到了一些,但我真的没有时间试一试,所以我想知道其他人有什么经验。如果你对你推荐的图书馆有一些经验,请回答。

P.S.:我也可以使用不同的库进行聚类和支持向量机。

EN

回答 6

Stack Overflow用户

回答已采纳

发布于 2010-05-30 14:53:14

好吧,为了完整起见,我会贴上我最后的文章。我现在使用枕-簇作为集群部分。这是迄今为止我发现的最通用的实现方式。我想我将使用支持向量机部分的libSVM (它现在有一个Python接口)。我之所以使用Python,是因为在C++中没有真正适合的分层集群实现( C聚类库专门用于微阵列,不支持多维数据)。

票数 5
EN

Stack Overflow用户

发布于 2010-05-27 02:27:22

我只使用了几个ML库,所以我很乐意推荐它们;dlib ml当然就是其中之一。

Sourceforge下载这里;和出血边缘检查:

代码语言:javascript
复制
hg clone http://hg.code.sf.net/p/dclib/code dclib-code

最初的图书馆创建者和现在的维护者是戴维斯·金。

您的愿望列表相对于相关的dlib特性:

  • good excellent :对于面向相对较少的用户/开发人员的免费开源库,这可能是最好的;除了在五年开发历史期间改进的常规文档之外,还有一个经常更新的http://dlib.net/intro.html、一个(低流量的)论坛;以及大量优秀的示例(至少包括一个支持向量机)。
  • C++ :据我所知,100%在C++。
  • 支持-向量机算法:是的;事实上,支持向量机模块一直是这个库最新更新的焦点。
  • 分层聚类算法:不是开箱即用;不过,有打包代码用于k-均值聚类。显然,每种技术的结果是非常不同的,但是相似度度量的计算和随后的递归/迭代划分步骤是这两种技术的核心--换句话说,分层聚类的计算引擎就在这里。要使现存的集群模块适应HC,需要几行代码,但考虑到您几乎是在数据表示级别工作,这也不是一项重大的工作。

dlib ml还有几点值得推荐。它是一个成熟的库(现在是17.x版本,版本1.x是在2005年底发布的),但它仍然在积极开发中,回购日志(上一次更新17.27是2010年5月17日)和最后一次提交(2010年5月23日)就是证明。此外,它还包括相当少的其他ML技术(例如,贝叶斯网络,核方法等)。第三,dllib ml为矩阵计算和优化提供了优秀的“支持”库--这两个库都是许多ML技术的基本构建块。

在源代码中,我注意到dlib ml是在BSL (Boost?)下授权的,这是一种开源许可,尽管我对这种许可类型一无所知。

票数 16
EN

Stack Overflow用户

发布于 2010-05-26 19:04:30

WEKA (http://www.cs.waikato.ac.nz/ml/weka/)是一个优秀的开源机器学习库,它满足了除C++之外的大多数需求--它是用C++编写的。它有很好的文档,实现了支持向量机和集群,我在这方面有过很好的经验。

票数 10
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2915341

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档