Java Regex中的零长度匹配

我的代码
Pattern pattern = Pattern.compile("a?");
Matcher matcher = pattern.matcher("ababa");
while(matcher.find()){
   System.out.println(matcher.start()+"["+matcher.group()+"]"+matcher.end());
}

输出

0[a]1
1[]1
2[a]3
3[]3
4[a]5
5[]5

我知道的 :

>“一个?”代表字符’a’的零或一次出现.

Java API说:

> matcher.start()返回上一个匹配的起始索引.
> matcher.end()返回最后一个字符匹配后的偏移量.
> matcher.group()返回与前一个匹配的输入子序列
比赛.对于具有输入序列s的匹配器,表达式
m.group()和s.substring(m.start(),m.end())是等价的.并为
某些模式(例如a *)匹配空字符串.这种方法
当模式成功匹配时,将返回空字符串
输入中的空字符串.

我想知道的是什么:

>在哪些情况下正则表达式引擎遇到零
出现一个给定的角色 – 这里是角色’a’.
>在那些情况下,start()实际返回的值是什么,
匹配器中的end()和group()方法.我已经提到了什么
java API说.但是在实际问题上我还不清楚
情况如上.

解决方法

的?是一个贪婪的量词,因此它会在尝试0次出现之前首先尝试匹配1次出现.在你的字符串中,

>它从第一个字符’a’开始,并尝试再次匹配1次出现. ‘a’字符匹配,因此它返回您看到的第一个结果
>然后它向前移动并找到’b’. ‘b’字符与正则表达式1出现不匹配,因此引擎回溯并尝试匹配0出现.结果是空字符串匹配 – >你得到了第二个结果.
>然后它在b之前移动,因为那里不再有匹配,并且它会再次以你的第二个“a”字符开始.
>等……你明白了……

它比这复杂一点,但这是主要的想法.当1次出现不匹配时,它将尝试0次出现.

至于start,end和group的值,它们将是匹配开始,结束和组匹配的位置,所以在你的字符串的第一个0-occurence匹配中,你得到1,1和emtpy字符串.我不确定这真的能回答你的问题.

相关文章

ArrayList简介:ArrayList 的底层是数组队列,相当于动态数组。与 Java 中的数组相比,它的容量能动态增...
一、进程与线程 进程:是代码在数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位。 线程...
本文为博客园作者所写: 一寸HUI,个人博客地址:https://www.cnblogs.com/zsql/ 简单的一个类...
#############java面向对象详解#############1、面向对象基本概念2、类与对象3、类和对象的定义格式4、...
一、什么是异常? 异常就是有异于常态,和正常情况不一样,有错误出错。在java中,阻止当前方法或作用域...
Collection接口 Collection接口 Collection接口 Collection是最基本的集合接口,一个Collection代表一组...