首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >大型数据集的Triplestore

大型数据集的Triplestore
EN

Stack Overflow用户
提问于 2011-02-07 12:43:19
回答 6查看 4.1K关注 0票数 13

我想问一个好的triplestore用于大型数据集,它应该:

  • 规模良好(百万三倍)
  • 有Java接口
EN

回答 6

Stack Overflow用户

回答已采纳

发布于 2011-02-07 12:46:28

您应该考虑使用OpenLink Virtuoso存储。它可以通过OpenSource许可证获得,并可扩展到数十亿的三倍。您可以通过Sesame和Jena API使用它。

有关大型三重商店的概述,请参见这里。Virtuoso显然比BigData更容易设置。除此之外,我还使用了芝麻NativeStore,它的比例不太好。

4商店也是一个不错的选择,尽管我还没有使用它。Virtuosoover4Store的一个优点是,您可以轻松地将标准关系模型与RDF混合,因为Virtuoso位于关系数据库的幕后。

票数 10
EN

Stack Overflow用户

发布于 2011-02-07 14:04:44

4存储:可伸缩的RDF存储

引用4店网站..。

4商店的主要优势在于性能、可扩展性和稳定性。它不提供RDF存储和SPARQL查询之外的许多特性,但是如果您正在寻找一个可伸缩、安全、快速和高效的RDF存储,那么4存储应该在您的短名单中。

就我个人而言,我已经用非常大的数据库(高达20亿个三倍)测试了4家商店,取得了非常好的结果。4存储是用C编写的,运行在Linux/Unix 64位平台上,当前版本1.1.1部分实现了SPARQL 1.1

4存储可以部署在商品服务器集群上,这可能会提高查询的性能,断言吞吐量可高达100 KTriple/秒。但是,即使您在单个服务器中使用它,您也会获得相当不错的性能。

在南安普敦大学是我们在研究项目中非常大的数据集的选择,也是我们的网站管理员团队的选择,参见南安普敦和ECS开放数据的数据存储

这里还列出了可以用于查询和管理4 4store 客户图书馆的所有库的列表。此外,4商店的IRC通道有一个活跃的用户社区,如果您遇到任何问题,这将对您有所帮助。

如果您是Linux/Unix用户,那么4 4store无疑是一个不错的选择。

票数 6
EN

Stack Overflow用户

发布于 2011-02-07 15:38:31

我也推荐4家商店,但本着完全公开的精神,我是首席架构师:)

如果您想要利用RDF存储的标准化,那么应该使用实现SPARQL的Java库,而不是使用本地公开JAVA的库。

否则,您可能会被首先选择的任何存储所困住,这是典型的SQL迁移地狱。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4921407

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档