正则表达式 - C语言

http://blog.csdn.net/pipisorry/article/details/37073843

sscanf/scanf正则用法

%[ ] 用法:%[ ]表示要读入一个字符集合,如果[ 后面第一个字符是”^”,则表示反意思。

[ ]内的字符串可以是1或更多字符组成。空字符集(%[])是违反规定的,可

导致不可预知的结果。%[^]也是违反规定的。

%[a-z] 读取在 a-z 之间的字符串,如果不在此之前则停止,如

char s[]="hello,my friend” ; // 注意:,逗号在不 a-z之间

sscanf( s,“%[a-z]”,string ) ; // string=hello

%[^a-z] 读取不在 a-z 之间的字符串,如果碰到a-z之间的字符则停止,如

char s[]="HELLOkitty” ; // 注意:,“%[^a-z]”,string ) ; // string=HELLO

%*[^=] 前面带 * 号表示不保存变量。跳过符合条件的字符串。

char s[]="notepad=1.0.0.1001" ;

char szfilename [32] = "" ;

int i = sscanf( s,"%*[^=]",szfilename ) ; // szfilename=NULL,因为没保存

int i = sscanf( s,"%*[^=]=%s",szfilename ) ; // szfilename=1.0.0.1001

%40c 读取40个字符

The run-time library does not automatically append a null terminator to the string,nor does reading 40 characters automatically terminate the scanf() function. Because the library uses buffered input,you must press the ENTER key to terminate the string scan. If you press the ENTER before the scanf() reads 40 characters,it is displayed normally, and the library continues to prompt for additional input until it reads 40 characters


%[^=] 读取字符串直到碰到’=’号,’^’后面可以带更多字符,如:

char s[]="notepad=1.0.0.1001" ;

char szfilename [32] = "" ;

int i = sscanf( s,"%[^=]",szfilename ) ; // szfilename=notepad

如果参数格式是:%[^=:] ,那么也可以从 notepad:1.0.0.1001读取notepad

使用例子:

char s[]="notepad=1.0.0.1001" ;

char szname [32] = "" ;

char szver [32] = “” ;

sscanf( s,"%[^=]=%s",szname,szver ) ; // szname=notepad,szver=1.0.0.1001

总结:%[]有很大的功能,但是并不是很常用到,主要因为:

1、许多系统的 scanf 函数都有漏洞. (典型的就是 TC 在输入浮点型时有时会出错).

2、用法复杂,容易出错.

3、编译器作语法分析时会很困难,从而影响目标代码的质量和执行效率.

个人觉得第3点最致命,越复杂的功能往往执行效率越低下。而一些简单的字符串分析我们可以自已处理。

[ sscanf/scanf正则用法]




补充:sscanf,scanf,fscanf中的正则表达式

每种语言都对正则表达式有着不同程度的支持,在C语言中,有输入功能的这三个函数对正则表达式的支持并不强大,但是我们还是有必要了解一下。
首先来看看他们的原型:
#include <stdio.h>
int scanf(const char *format,...);
int fscanf(FILE *stream,const char *format,...);
int sscanf(const char *str,...);
均可以接受变参,sscanf与scanf类似,可以将标准输入(stdin)作为输入源。最关键的部分,就是format这个参数了。它可以是一个或者多个 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' | '\n' | 非%符号}。
参数解释:

  1、 * 亦可用于格式中,(即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)

  2、{a|b|c}表示a,b,c中选一,[d],表示可以有d也可以没有d。

  3、width表示读取宽度。

  4、{h | l | I64 | L}:参数的size,通常h表示单字节size,I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。

  5、type : 就是%s,%d之类。

  6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标参数中写入值

支持的集合操作:%[a-z] 表示匹配a到z中任意字符,贪婪性(尽可能多的匹配)%[aB'] 匹配a、B、'中一员,贪婪性%[^a] 匹配非a的任意字符,贪婪性

返回值
这三个函数返回成功匹配和分配的输入项。意思就是你在format参数列表中的格式,返回值可以比你提供的匹配项目数少(有些将会匹配失败)。提前匹配失败则返回0。如果达到文件末尾,则返回EOF,当发生错误的时候也将返回EOF。你可以通过输出errno来查看错误代码

如果使用fscanf来判断文件是否结束,将会存在安全隐患,如果每次读取的时候都是匹配失败,那么返回值永远都不会是EOF。scanf族的函数都是要先将数据读入缓冲区,然后在冲缓冲里读取。
注意:scanf族函数会忽略一行开始的空白
from: http://www.jb51.cc/article/p-nbfeshwq-bbo.html

相关文章

一、校验数字的表达式 1 数字:^[0-9]*$ 2 n位的数字:^d{n}$ 3 至少n位的数字:^d{n,}$ 4 m-n位的数字...
正则表达式非常有用,查找、匹配、处理字符串、替换和转换字符串,输入输出等。下面整理一些常用的正则...
0. 注: 不同语言中的正则表达式实现都会有一些不同。下文中的代码示例除特别说明的外,都是使用JS中的...
 正则表达式是从信息中搜索特定的模式的一把瑞士军刀。它们是一个巨大的工具库,其中的一些功能经常...
一、校验数字的表达式 数字:^[0-9]*$ n位的数字:^\d{n}$ 至少n位的数字:^\d{n,}$ m-n位的数...
\ 将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如,“n”匹配字符“n”。“\n...