晚上好,
我试图通过Java将德国地址字符串的各个部分拆分成它的部分.有没有人知道正则表达式或图书馆这样做?要拆分它,如下所示:
NamederStraße25a88489 Teststadt
至
NamederStraße| 25a | 88489 | Teststadt
要么
Teststr. 3 88489 Beispielort(GroßerKreis)
至
Teststr.| 3 | 88489 | Beispielort(GroßerKreis)
如果系统/正则表达式仍然有效,如果缺少像邮政编码或城市这样的部分,那将是完美的.
有没有我可以存档的正则表达式或库?
编辑:德国地址规则:
街:人物,数字和空格
房屋号码:数字和任何字符(或空格),直到一系列数字(zip)(至少在这些例子中)
邮编:5位数
地方或城市:其余的也可能有空格,逗号或大括号
解决方法
我遇到了类似的问题,并稍微调整了这里提供的解决方案,并找到了这个解决方案也可以工作,但(imo)有点简单易懂和扩展:
/^([a-zäöüß\s\d.,-]+?)\s*([\d\s]+(?:\s?[-|+/]\s?\d+)?\s*[a-z]?)?\s*(\d{5})\s*(.+)?$/i
这里有一些example matches.
它还可以处理丢失的街道号码,并且可以通过向字符类添加特殊字符来轻松扩展.
[a-zäöüß\s\d,.-]+? # Street name (lazy) [\d\s]+(?:\s?[-|+/]\s?\d+)?\s*[a-z]?)? # Street number (optional)