首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >免费库:我公司的整个数据库都建立在它的基础上值得吗?

免费库:我公司的整个数据库都建立在它的基础上值得吗?
EN

Stack Overflow用户
提问于 2012-08-16 20:02:20
回答 1查看 849关注 0票数 3

我在一家正在为现场音乐建立场地/艺术家数据库的公司工作,最近我遇到了Freebase。它看起来非常引人注目,即使数据没有新的,即将到来的乐队。对于那些曾经在Freebase工作过的人,我有几个问题:

  1. 是否存在将所有数据输入与Freebase集成的不利因素?我们不打算出售或私有化这些信息。
  2. 在可用性方面,Freebase的缺点是什么?
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-08-21 01:23:34

信息披露:我在谷歌的Freebase工作。

Freebase中的音乐数据是我们最强大的领域之一,随着我们继续加载更多的数据集,它将继续变得越来越广泛和丰富。例如,我们从MusicBrainz导入数据,清理数据,并将主题与Freebase中的现有主题匹配,以避免重复。

  1. 就缺点而言,您应该准备好处理大量的数据。例如,Freebase目前有4位名为“约翰·史密斯”的音乐艺术家,它可能对您的应用程序有用,也可能没有用,但是您仍然需要弄清楚您的用户感兴趣的是哪个映射到John。我们称之为“协调”,它是必要的,以便您的应用程序能够准确地知道查询API的主题。 由于您提到了音乐场所,我还应该指出,虽然Freebase有很多关于地方的数据,但是我们还没有一个geosearch,所以如果您需要的话,您需要自己滚动。 因为任何人都可以编辑Freebase,所以您也应该考虑使用时间来保护您的站点免受破坏。
  2. 对于开发人员来说,Freebase非常好,因为您可以轻松地跳入并清除坏数据或添加缺少的主题。然而,一个一直是挑战的领域是从谷歌外部加载大量数据。我们已经构建了允许用户上传数据集的OpenRefine,但是这些数据集必须通过一个QA过程,这个过程需要一些时间才能完成。拥有这些QA过程以保持Freebase的质量水平是必要的,但它确实减缓了加载大型数据集的过程。

我真的希望你选择利用免费基础音乐数据来建立你的公司。我知道已经有很多音乐初创公司很高兴地利用我们的数据。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11994634

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档