所以我收到了一个项目,我正试图为它找到一个前提。从本质上讲,我将从多个事务数据库中获取客户信息。然后将它们合并到一个维度表中,其中包含来自所有记录的各种有趣信息。这些人中的一些人可能在许多数据库中,或者多次在同一个数据库中,或者两者兼而有之。
由于名字来自用户输入,一个条目可能会说Sally Jones,一个人可能会说苏珊·琼斯,一个人可能会说S Jones,但它仍然是同一个人。我的想法是找到尽可能多的名称的消歧方法,并将其放入桥接表中,这样,当我从事务数据库中提取新信息时,我可以通过桥接表运行它,并匹配列出的任何名称
有没有人做过或听说过类似的事情?或者知道一个可以导入到excel/sql中的表格/列表,它将为我消除名字歧义提供一个起点?
发布于 2015-10-20 21:44:39
基本上,您需要一个Clients表和一种将此表与Transactions表关联的方法。如果数据库中不存在clients表,我建议您创建它来完成您的任务。非常重要的一点是,每个客户端都有一个单一的标识,并将客户端与事务连接起来,以便准确了解每个客户端的所有事务。
https://stackoverflow.com/questions/33174683
复制相似问题