但凡稍微有点资历的程序员,都免不了要写正则表达验证算法。
最近见到好几个正则表达式的Bug,抽空写出来。
拿邮箱验证来说,网上绝大部分人写的邮箱验证正则表达式代码都不能验证这邮箱:
i@julying.com,也不能验证 xxxxxx@i.com 。
上次我发现youku.com(优酷网)用户注册就有这个问题,见图:
今天发现 QQ微信 也同样有这个问题:
他们都不能验证一个字母的域名或一个字母的用户名。
很久之前,最初写正则的程序员偷懒了,没有写 这样情况的正则表达式验证,
他当时可能觉得这样的正则比较麻烦,而且可能这样的邮箱实在太少了,
没有听说一个字母的顶级域名提供邮箱服务,也没有见那个邮箱的用户名是一个字母的,于是就没写。
而后来的程序员就一直沿用这个代码。。。。。
——————-
因为程序不能处理位置类型的数据,比如 2003年网络大面积爆发 sql 注入,就是一个经典案例。
正如比尔盖茨前辈说:用户的所有输入都是有害的,程序员要尽可能的验证所有可能性,否则,漏掉的可能性就是一个潜在的危机。
——————-
我顺便写一个完整的邮箱验证正则表达式吧,以后不要搞这种错误,让人很郁闷。。
PHP 邮箱验证正则表达式:
preg_match(“/^[0-9a-zA-Z]+@(([0-9a-zA-Z]+)[.])+[a-z]{2,4}$/i”,$email );
如果需要更加完善、严格的验证,修改这个正则表达式即可。
PHP 邮箱验证正则表达式 新手实例:
<?PHP
function isEmail($email){
if(preg_match(“/^[0-9a-zA-Z]+@(([0-9a-zA-Z]+)[.])+[a-z]{2,$email )){
return ‘是邮箱’;
} else{
return ‘不是邮箱’;
}
}
?>
Javascript(js) 邮箱验证正则表达式:
myreg = /^([a-zA-Z0-9]+[_|_|.]?)*[a-zA-Z0-9]+@([a-zA-Z0-9]+[_|_|.]?)*[a-zA-Z0-9]+.[a-zA-Z]{2,4}$/;
这个可以验证 形如:i@julying.com,i@i.com 这种邮箱
Javascript(js) 邮箱验证正则表达式 新手实例:
<script type=”text/javascript”>
function isEmail(val){
var myreg = /^([a-zA-Z0-9]+[_|_|.]?)*[a-zA-Z0-9]+@([a-zA-Z0-9]+[_|_|.]?)*[a-zA-Z0-9]+.[a-zA-Z]{2,4}$/;
if(!myreg.test(val))
return ‘不是邮箱’;
return ‘是邮箱’;
};
alert( isEmail(‘i@julying.com’) );
</script>