我的正则表达式导致Java中的堆栈溢出;我错过了什么?

前端之家收集整理的这篇文章主要介绍了我的正则表达式导致Java中的堆栈溢出;我错过了什么?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我试图使用Scanner的正则表达式来匹配文件中的字符串.正则表达式适用于该行以外的所有内容
  1. DNA="ITTTAITATIATYAAAYIYI[....]ITYTYITTIYAIAIYIT"

在实际文件中,省略号代表数千个字符.

当读取文件的循环到达包含基数的行时,会发生堆栈溢出错误.

这是循环:

  1. while (scanFile.hasNextLine()) {
  2. final String currentLine = scanFile.findInLine(".*");
  3. System.out.println("trying to match '" + currentLine + "'");
  4. Scanner internalScanner = new Scanner(currentLine);
  5. String matchResult = internalScanner.findInLine(Constants.ANIMAL_INFO_REGEX);
  6. assert matchResult != null : "there's no reason not to find a match";
  7. matches.put(internalScanner.match().group(1),internalScanner.match().group(2));
  8. scanFile.nextLine();
  9. }

和正则表达式:

  1. static final String ANIMAL_INFO_REGEX = "([a-zA-Z]+) *= *\"(([a-zA-Z_.]| |\\.)+)";

这是失败追踪:

  1. java.lang.StackOverflowError
  2. at java.util.regex.Pattern$CharProperty.match(Pattern.java:3360)
  3. at java.util.regex.Pattern$Branch.match(Pattern.java:4131)
  4. at java.util.regex.Pattern$GroupHead.match(Pattern.java:4185)
  5. at java.util.regex.Pattern$Loop.match(Pattern.java:4312)
  6. at java.util.regex.Pattern$GroupTail.match(Pattern.java:4244)
  7. at java.util.regex.Pattern$BranchConn.match(Pattern.java:4095)
  8. at java.util.regex.Pattern$CharProperty.match(Pattern.java:3362)
  9. at java.util.regex.Pattern$Branch.match(Pattern.java:4131)
  10. at java.util.regex.Pattern$GroupHead.match(Pattern.java:4185)
  11. at java.util.regex.Pattern$Loop.match(Pattern.java:4312)
  12. at java.util.regex.Pattern$GroupTail.match(Pattern.java:4244)
  13. at java.util.regex.Pattern$BranchConn.match(Pattern.java:4095)
  14. at java.util.regex.Pattern$CharProperty.match(Pattern.java:3362)
  15. at java.util.regex.Pattern$Branch.match(Pattern.java:4131)
  16. at java.util.regex.Pattern$GroupHead.match(Pattern.java:4185)
  17. at java.util.regex.Pattern$Loop.match(Pattern.java:4312)
  18. at java.util.regex.Pattern$GroupTail.match(Pattern.java:4244)
  19. at java.util.regex.Pattern$BranchConn.match(Pattern.java:4095)
  20. ...etc (it's all regex).

非常感谢!

这看起来像 bug 5050507.我同意Asaph的说法,取消交替应该有所帮助;该bug专门说“尽可能避免交替”.我想你可能会更简单:
  1. "^([a-zA-Z]+) *= *\"([^\"]+)"

猜你在找的正则表达式相关文章