最近在写个爬虫,要去爬一些网站获得数据,这个过程中遇到字符串截取的问题,超哥指点了我,帮了个大忙啊
http://regexpal.com/还有http://www.regexr.com/这两个网站可以测试你的正则表达式~
除此之外,谷歌浏览器的开发者工具也很好用,F12后在console里面可以直接进行操作
例如:http://market.scau.edu.cn/goods.PHP?iid=1407246132s7jn1j8b&iaction=view&st=0f 这样一个字符串,我要取得 iid
在console里面输入 var item ="http://market.scau.edu.cn/goods.PHP?iid=1407246132s7jn1j8b&iaction=view&st=0f"
item.match(/iid=([0-9a-z]+)&iaction=(\w+)&st=(\w+)/)
会返回["iid=1407246132s7jn1j8b&iaction=view&st=0f",1407246132s7jn1j8b"view"0f"] 这样一个数组
利用捕获可以简单方便得获得想要的字符。
原文链接:https://www.f2er.com/regex/361436.html