我有一个名单的名字,我需要把他们分成名字和姓氏。因为有些名字中有2-3个空格,所以一个空格的简单分割是行不通的。
人们使用什么样的启发式来执行拆分?
请注意,这不是一个重复的问题,有效地问如何分裂在一个空间;我在寻找启发式和算法,而不是实际的代码帮助。
更新:我把问题集限制在英式名称上。这是我需要解决的所有问题,很可能是所有接近这个(英语)问题的人都需要的。
发布于 2012-11-03 14:19:20
我读过一篇关于这个主题的非常有趣和全面的文章:
http://www.w3.org/International/questions/qa-personal-names
它甚至建议你问问自己,你是否真的需要对名字和姓氏分开的字段。它似乎取决于应用程序的目标区域。
发布于 2012-11-03 14:24:22
虽然没有完全解决这个问题,但有两种方法是有帮助的。
不是一个真正的答案,但在这种情况下,真的没有完美的答案。
发布于 2012-11-03 14:08:06
不同的国家和地区有不同的名称格式。例如,亚洲的姓氏通常是先命名后再命名的。在西方,你有名字和姓的约定,但是当人们用双桶或者中间的名字时,会变得很复杂。然后一些地区的人只被赋予一个名字。
就我个人而言,恐怕没有一种算法能给你100%的精确结果。
https://stackoverflow.com/questions/13209894
复制相似问题