我需要在C#中使用一个正常的
Regex代码来检测字符串中的纯文本URL(http / https / ftp / ftps),并通过在其周围放置一个带有相同url的锚标记来使它们可单击.我已经制作了一个Regex模式,代码附在下面.
但是,如果输入字符串中已存在任何可点击的URL,则上面的代码会在其上添加另一个锚标记.例如,下面代码中的现有子字符串:string sContent:“ftp://www.abc.com’\u0026gt; ftp://www.abc.com”在运行下面的代码时,它上面有另一个锚标记.有没有办法解决它?
string sContent = "ttt <a href='ftp://www.abc.com'>ftp://www.abc.com</a> abc ftp://www.abc.com abbbbb http://www.abc2.com"; Regex regx = new Regex("(http|https|ftp|ftps)://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,]*)?",RegexOptions.IgnoreCase); MatchCollection mactches = regx.Matches(sContent); foreach (Match match in mactches) { sContent = sContent.Replace(match.Value,"<a href='" + match.Value + "'>" + match.Value + "</a>"); }
此外,我想要一个正则表达式代码,使用“mailto”标签可以点击电子邮件.我可以自己做,但上面提到的双锚标签问题也会出现在其中.
解决方法
我在你的示例测试字符串中注意到,如果重复链接,例如ftp://www.abc.com在字符串中并且已经链接,然后结果将双重锚定该链接.您已经拥有的正则表达式以及@stema提供的正则表达式将起作用,但您需要以不同方式处理如何替换sContent变量中的匹配项.
string sContent = "ttt <a href='ftp://www.abc.com'>ftp://www.abc.com</a> abc ftp://www.abc.com abbbbb http://www.abc2.com"; Regex regx = new Regex("(?<!(?:href='|<a[^>]*>))(http|https|ftp|ftps)://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,RegexOptions.IgnoreCase); MatchCollection matches = regx.Matches(sContent); for (int i = matches.Count - 1; i >= 0 ; i--) { string newURL = "<a href='" + matches[i].Value + "'>" + matches[i].Value + "</a>"; sContent = sContent.Remove(matches[i].Index,matches[i].Length).Insert(matches[i].Index,newURL); }