我想问一个好的triplestore用于大型数据集,它应该:
发布于 2011-02-07 12:46:28
您应该考虑使用OpenLink Virtuoso存储。它可以通过OpenSource许可证获得,并可扩展到数十亿的三倍。您可以通过Sesame和Jena API使用它。
有关大型三重商店的概述,请参见这里。Virtuoso显然比BigData更容易设置。除此之外,我还使用了芝麻NativeStore,它的比例不太好。
4商店也是一个不错的选择,尽管我还没有使用它。Virtuosoover4Store的一个优点是,您可以轻松地将标准关系模型与RDF混合,因为Virtuoso位于关系数据库的幕后。
发布于 2011-02-07 14:04:44
4存储:可伸缩的RDF存储
引用4店网站..。
4商店的主要优势在于性能、可扩展性和稳定性。它不提供RDF存储和SPARQL查询之外的许多特性,但是如果您正在寻找一个可伸缩、安全、快速和高效的RDF存储,那么4存储应该在您的短名单中。
就我个人而言,我已经用非常大的数据库(高达20亿个三倍)测试了4家商店,取得了非常好的结果。4存储是用C编写的,运行在Linux/Unix 64位平台上,当前版本1.1.1部分实现了SPARQL 1.1。
4存储可以部署在商品服务器集群上,这可能会提高查询的性能,断言吞吐量可高达100 KTriple/秒。但是,即使您在单个服务器中使用它,您也会获得相当不错的性能。
在南安普敦大学是我们在研究项目中非常大的数据集的选择,也是我们的网站管理员团队的选择,参见南安普敦和ECS开放数据的数据存储。
这里还列出了可以用于查询和管理4 4store 客户图书馆的所有库的列表。此外,4商店的IRC通道有一个活跃的用户社区,如果您遇到任何问题,这将对您有所帮助。
如果您是Linux/Unix用户,那么4 4store无疑是一个不错的选择。
发布于 2011-02-07 15:38:31
我也推荐4家商店,但本着完全公开的精神,我是首席架构师:)
如果您想要利用RDF存储的标准化,那么应该使用实现SPARQL的Java库,而不是使用本地公开JAVA的库。
否则,您可能会被首先选择的任何存储所困住,这是典型的SQL迁移地狱。
https://stackoverflow.com/questions/4921407
复制相似问题