我有两个杂乱无章的名字数据库,如下所示:
我要找到火柴。有人能为我指出或建议一个好的食谱,如何在谷歌精炼?
这个链接给了我一个起点,但我需要进一步的建议:http://blog.ouseful.info/2011/05/06/merging-datesets-with-common-columns-in-google-refine/
发布于 2012-05-07 21:04:09
您可以尝试改进扩展,尤其是文档的和解部分。
发布于 2012-05-16 13:31:16
cell.cross函数类似于Excel中的vlookup,只有当两个单元格相同时,它才会匹配。如果您想要使用此方法,则需要在此之前对数据进行大量的群集和清理。
我支持迈克尔的回答。尝试一个协调服务: rdf服务或公开和解。
https://stackoverflow.com/questions/10472601
复制相似问题