请对Java贝叶斯推理框架提出建议:
1. Is open-source
2. Can be used programmatically from Java app.
3. Will be able to process 10 GB data-set running on a single host (node)
4. NOT Mahout or any other Hadoop-based / distributed frameworks (see 3.)发布于 2013-04-07 22:13:50
数据的大小将不是限制因素,而是您要更新的模型的复杂性。如果它是一个简单的朴素贝叶斯模型,那么它很容易实现。如果你想要更复杂的东西,例如多连接网络,那么模型的复杂性将决定你是否可以进行精确的推理,或者是否需要权衡,例如近似算法。
凯文·墨菲最近在http://www.cs.ubc.ca/~murphyk/Software/bnsoft.html上更新了贝叶斯推理软件的比较。我正在研究的一个开放源码包是libDAI (http://cs.ru.nl/~jorism/libDAI/),它是用C++编写的,但我假设它可以从Java语言中调用。它支持多种推理方法,包括循环信任传播,这似乎是一种非常好的近似算法。
发布于 2013-04-02 18:47:05
也许weka符合你的要求?http://www.cs.waikato.ac.nz/ml/weka/它绝对满足了要求1,2和4。3如果默认的weka.core.Instances没有提供某种类型的“流”数据,那么它应该可以通过自定义实现来实现,所以不是所有的数据都需要一次都驻留在内存中--已经有一段时间没有使用它了,所以我不确定。
https://stackoverflow.com/questions/15761665
复制相似问题