Regular expression that matches valid IPv6 addresses
这个问题实际上有一个答案,几乎回答了我的问题,但不完全.
private string RemoveIPv6(string sInput) { string pattern = @"(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,6}:[0-9a-fA-F]{1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}(:[0-9a-fA-F]{1,3}|([0-9a-fA-F]{1,3}(:[0-9a-fA-F]{1,2}(:[0-9a-fA-F]{1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,6})|:((:[0-9a-fA-F]{1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9])|([0-9a-fA-F]{1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]))"; //That is one looooong regex! From: https://stackoverflow.com/a/17871737/3472690 //if (IsCompressedIPv6(sInput)) // sInput = UncompressIPv6(sInput); string output = Regex.Replace(sInput,pattern,""); if (output.Contains("Addresses")) output = output.Substring(0,"Addresses: ".Length); return output; }
与本答案David M. Syzdek’s Answer中提供的正则表达式模式有关的问题是,它不匹配并删除我抛出的IPv6地址的完整形式.
我正在使用正则表达式模式主要用空格或空值替换字符串中的IPv6地址.
例如,
Addresses: 2404:6800:4003:c02::8a
以及…
Addresses: 2404:6800:4003:804::200e
最后…
Addresses: 2001:4998:c:a06::2:4008
所有这些都不能被正则表达式完全匹配,或者不能完全匹配.
正则表达式将返回字符串的其余部分,如下所示:
Addresses: 8a Addresses: 200e Addresses: 2:4008
可以看出,由于遗留的格式不同,IPv6地址的遗留问题很难被检测和删除.下面是正则表达式本身,以便更好地分析:
(([0-9a-fA-F]{1,1}[0-9]))
因此,我的问题是,如何纠正这种正则表达式模式,以便可以匹配,从而允许从不仅仅包含IPv6地址本身的字符串中完全删除任何IPv6地址?
或者,我如何更正我提供的代码片段来提供所需的结果?
对于那些可能想知道的人,我从nslookup命令的StandardOutput获取字符串,并且IPv6地址总是不同.对于上面的例子,我从“google.com”和“yahoo.com”获得了这些IPv6地址.
我没有使用内置函数来解决DNS条目,这是一个很好的理由,我不认为这一切将会很重要,因此我正在使用nslookup.
对于调用该函数的代码,如果需要,如下所示:(它本身也是另一个函数/方法,或者是其中的一部分)
string output = ""; string garbagecan = ""; string tempRead = ""; string lastRead = ""; using (StreamReader reader = nslookup.StandardOutput) { while (reader.Peek() != -1) { if (LinesRead > 3) { tempRead = reader.ReadLine(); tempRead = RemoveIPv6(tempRead); if (tempRead.Contains("Addresses")) output += tempRead; else if (lastRead.Contains("Addresses")) output += tempRead.Trim() + Environment.NewLine; else output += tempRead + Environment.NewLine; lastRead = tempRead; } else garbagecan = reader.ReadLine(); LinesRead++; } } return output;
更正的正则表达式应该只允许删除IPv6地址,并保持IPv4地址不变.将传递到正则表达式的字符串不会单独包含IPv6地址,并且几乎总是包含其他详细信息,因此,地址将在哪个索引出现是不可预测的.在第一次发生IPv6地址之后,正则表达式也会跳过所有其他IPv6地址,因为某些原因,应该注意.
道歉,如果有任何遗漏的细节,我会尽力把他们包括在什么时候提醒.我也喜欢工作代码示例,如果可能,因为我几乎没有关于正则表达式的知识.
解决方法
(?:^|(?<=\s))(([0-9a-fA-F]{1,1}[0-9]))(?=\s|$)
使用回顾,您可以强制执行完全匹配,而不是部分匹配.请参阅演示.