首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >面向大数据集的Java贝叶斯推理框架

面向大数据集的Java贝叶斯推理框架
EN

Stack Overflow用户
提问于 2013-04-02 18:21:29
回答 2查看 1.2K关注 0票数 2

请对Java贝叶斯推理框架提出建议:

代码语言:javascript
复制
1. Is open-source
2. Can be used programmatically from Java app.
3. Will be able to process 10 GB data-set running on a single host (node) 
4. NOT Mahout or any other Hadoop-based / distributed frameworks (see 3.)
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-04-07 22:13:50

数据的大小将不是限制因素,而是您要更新的模型的复杂性。如果它是一个简单的朴素贝叶斯模型,那么它很容易实现。如果你想要更复杂的东西,例如多连接网络,那么模型的复杂性将决定你是否可以进行精确的推理,或者是否需要权衡,例如近似算法。

凯文·墨菲最近在http://www.cs.ubc.ca/~murphyk/Software/bnsoft.html上更新了贝叶斯推理软件的比较。我正在研究的一个开放源码包是libDAI (http://cs.ru.nl/~jorism/libDAI/),它是用C++编写的,但我假设它可以从Java语言中调用。它支持多种推理方法,包括循环信任传播,这似乎是一种非常好的近似算法。

票数 3
EN

Stack Overflow用户

发布于 2013-04-02 18:47:05

也许weka符合你的要求?http://www.cs.waikato.ac.nz/ml/weka/它绝对满足了要求1,2和4。3如果默认的weka.core.Instances没有提供某种类型的“流”数据,那么它应该可以通过自定义实现来实现,所以不是所有的数据都需要一次都驻留在内存中--已经有一段时间没有使用它了,所以我不确定。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15761665

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档