首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Google改进了在两个数据库中协调混乱实体的方法

Google改进了在两个数据库中协调混乱实体的方法
EN

Stack Overflow用户
提问于 2012-05-06 17:23:16
回答 2查看 799关注 0票数 3

我有两个杂乱无章的名字数据库,如下所示:

  • 金达尔,鲍比
  • 弗拉。鲍比·金达尔州长
  • 鲍比·金达尔
  • 3M公司
  • 3米梅诺米

我要找到火柴。有人能为我指出或建议一个好的食谱,如何在谷歌精炼?

这个链接给了我一个起点,但我需要进一步的建议:http://blog.ouseful.info/2011/05/06/merging-datesets-with-common-columns-in-google-refine/

EN

回答 2

Stack Overflow用户

发布于 2012-05-07 21:04:09

您可以尝试改进扩展,尤其是文档的和解部分。

票数 2
EN

Stack Overflow用户

发布于 2012-05-16 13:31:16

cell.cross函数类似于Excel中的vlookup,只有当两个单元格相同时,它才会匹配。如果您想要使用此方法,则需要在此之前对数据进行大量的群集和清理。

我支持迈克尔的回答。尝试一个协调服务: rdf服务或公开和解

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10472601

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档