其中一列的数据如下所示,我只需要郊区名称,而不是州或邮政编码。
我正在使用Alteryx并尝试regex (\<\w+\>)\s\<\w+\>,但是只获得了一些新列的记录。
输入:
CABRAMATTA
CANLEY HEIGHTS
ST JOHNS PARK
Parramatta NSW 2150
Claymore 2559
CASULA输出
CABRAMATTA
CANLEY HEIGHTS
ST JOHNS PARK
Parramatta
Claymore
CASULA 发布于 2015-03-14 11:20:09
这个regex匹配所有的字母单词,但不包括澳大利亚州的缩写(因为地址显然是澳大利亚的):
( ?(?!(VIC|NSW|QLD|TAS|SA|WA|ACT|NT)\b)\b[a-zA-Z]+)+请参阅演示
负面展望包括一个单词边界,允许以州缩写开头的郊区(参见演示)。
发布于 2018-09-04 16:09:11
扩展波希米亚的答案,您可以使用分组在alteryx中执行REGEXP替换。所以:
REGEX_Replace([Field1], "(.*)(\VIC|NSW|QLD|TAS|SA|WA|ACT|NT)+(\s*\d+)" , "\1")这将抓住任何匹配的第一组(所以只是郊区)。第二组和第三组与州和拉链相匹配。不是一个完美的准则,但应该让你大部分的路到那里。
发布于 2021-04-12 10:06:19
我认为这个工作流会帮助你:

https://stackoverflow.com/questions/29046626
复制相似问题