Logical Operator | :
X|Y :| 可以理解为 “或”。正则表达式中带分支(即包含 |)的时候,它会按分支的顺序从左到右匹配。需要注意的一点是:从左到右匹配的过程中一旦找到某个匹配就会停止对其它条件的匹配。(例子可以看下面第三个例子)
- Ggicci|ggicci 可以匹配 Ggicci 或者 ggicci,这个同 [Gg]gicci
- 假设某个地区的电话的表示有两种表示方法:xxx-xxxxxxxx 和 xxxx-xxxxxxx 其中 x 代表某个数字,那么其正则表达式可以这样写:\d{3}-\d{8}|\d{4}-\d{7}
- 一个需要注意的例子:
1: String source = "Ggicci-1991-11-10 and Tengery-1991";
2: Pattern pattern = Pattern.compile("\\w+-\\d{4}-\\d{2}-\\d{2}|\\w+-\\d{4}");
3: Matcher matcher = pattern.matcher(source);
4: while (matcher.find()) {
5: System.out.println(matcher.group());
6: }
把上面正则表达式的两个分支调换顺序:"\\w+-\\d{4}|\\w+-\\d{4}-\\d{2}-\\d{2}");2: Ggicci-1991
3: Tengery-1991
解释: \w+\d{4} 在匹配了 Ggicci-1991-11-10 中的 Ggicci-1991 部分后就不再考虑后面的分支条件 \w+\d{4}-\d{2}-\d{2} 了,所以这个图则表达式匹配不了 Ggicci-1991-11-10 这种格式的字符串。所以在写分支条件的时候一定要注意顺序,即前面的分支条件是否是后面分支条件的子条件。