首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何获取图书元数据?

如何获取图书元数据?
EN

Stack Overflow用户
提问于 2010-07-20 06:07:51
回答 4查看 24.6K关注 0票数 29

我的应用程序需要根据提供的ISBN、标题或作者检索有关任何已出版书籍的信息。这并不是一个独特的要求--像Amazon.com,Chegg.com,甚至像Book收集器这样的软件似乎都能轻松地做到这一点。但我无法复制它。

为了澄清,我不需要搜索整个数据库的书籍--只有一个有限的子集已经被输入,比如在一个藏书中。数据库只允许我用必要的元数据标记输入的书籍,以便对该子集的图书进行搜索。因此,规模不是问题所在--获取元数据。

我尝试过的方案如下:

  1. 抓取亚马逊。对亚马逊普通页面的抓取不是很好,比如缺少作者,虽然较小的移动页面的抓取速度更快,但它们在提取的健壮性方面有着相同的问题。另外,将其构建到应用程序中显然违反了Amazon的服务条款。
  2. 尽管的法律影响似乎较小,但它的易用性和健壮性再次成为了问题。
  3. ISBNdb.com API.虽然服务在一定程度上是免费的,并且在返回必要的元数据方面做得很好,但我需要每天对500多本图书这样做,在这一点上,该服务的使用成本是成比例的。我更喜欢免费或一次性支付解决方案,允许我这样做。
  4. Google .虽然似乎提供了我需要的信息,但我不能按照他们的服务条款显示图书预览。
  5. 购买了图书数据库的许可证。例如,英格拉姆或贝克&泰勒这样的公司向零售商和图书馆提供这些目录。这个解决方案显然是昂贵的,所以我希望有一个更优雅的解决方案,我错过了。但是如果不是这样的人已经有了一个良好的经验,一个特定的数据库,我愿意这样做。

我试图详细地描述我的方法,以便其他书籍较少的人可以利用上述解决方案。但考虑到我的需求,我在检索书籍元数据方面已经束手无策,因此,任何指针都会受到极大的赞赏。

EN

回答 4

Stack Overflow用户

发布于 2010-07-20 06:38:05

因为不太可能每天都要检索相同的500本书:将从isbndb.com检索的数据存储在数据库中,然后逐本填写。

票数 4
EN

Stack Overflow用户

发布于 2011-05-16 20:27:15

您可以使用他们为其附属程序公开的API:https://affiliate-program.amazon.com/gp/advertising/api/detail/main.html,而不是刮掉亚马逊。

它允许每小时3k的请求,并返回格式良好的XML。它要求你设置一个链接到书,你显示有关的信息,你必须声明你是一个附属合作伙伴。

票数 4
EN

Stack Overflow用户

发布于 2018-05-08 14:39:33

这可能就是你要找的。他们甚至提供完整的下载!https://openlibrary.org/data

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3287433

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档