我有一个列出体育比分的网站。It current的工作原理是这样的:
名字姓1-0名字姓
它根据空格来分解它,然后根据-来分解第三个(包含分数)。
这样做的问题是它不支持超过2个单词的名称。如果我使用- first进行分解,它将不支持其中带有-的名称。结果被添加到文本区域中,因为我需要添加数千个结果,所以我不想创建多个字段来输入数据,因为我目前可以快速添加匹配,每行列出一个结果。有没有人有关于如何使系统同时支持多个单词和不区分特殊字符的建议?当它遇到一个数字时,是否有一种方法可以拆分,然后选择第一个块作为名字,最后一个块作为玩家得分,其余的作为姓氏?
发布于 2012-03-21 03:18:43
我不知道是否有任何方法可以教一个简单的解析命令,甚至是一个正则表达式,来做你想做的事情。有些情况总是模棱两可的。例如,如果你的名字是‘`Mary’和"Constantin Van Dyke“,模式是完全相同的,但一个需要拆分(2/1),另一个需要拆分(1/2)。
你可能会找到一个图书馆,它知道如何根据一个巨大的已知名称字典进行有根据的猜测,但如果做不到这一点……
我认为在这种情况下,你需要人脑输入数据来做出一些决定,并在数据输入过程中指示它们。在我的经验中,使用多个字段并不是那么慢,如果你使用Tab键导航,而不是到处移动鼠标。您也可以使用自己的分隔符输入数据,例如:
Mary Ann,Steiner,2-3
Constantin,Van Dyke,4-2然后,您可以运行一些程序,根据",“分解这些行,并将元素输入到数据库中。
如果从外部站点复制/粘贴或抓取数据,另一种选择是使用当前使用的方法分解每一行。这应该适用于大多数记录,当它不起作用时,这将是显而易见的--结果记录将具有太多的元素。您可以让您的脚本只标记这些记录,以便进行人工干预。
https://stackoverflow.com/questions/9790511
复制相似问题