正则表达式是通过使用一些特殊字符的排列,来表示一类字符串的共有模式,它不是一个具体的工具,只是一个标准,只要符合这个标准就可以使用正则表达式,从而可以达到过滤分析信息的目的。
@H_301_4@重要概念
- 正则表达式与bash中的完用字符并不相同,完用字符是bash接口提供的一个功能,正则表达式则是一种字符串的表示方式,需要分开学习。
- 特殊符号:[:alnum:]英文大小写字符及数字,[:alpha:]任何英文大小写字母,[:digit:]数字,[:lower:]任何小写字母,[:upper:]任何大写字母。
3.重要命令
- dmesg:显示内核的调试信息。
- sed:一个可以进行过滤和转换的流编辑工具。
- printf:用于数据的格式化输出。
- awk:将一行分为许多字段,以字段为单位利用一系列动作进行处理。
- diff:以行为单位对两个文件中的数据进行比较。
- cmp:以字节为单位对两个文件中的数据进行比较。
- patch:将文件的差异制作成补丁文件,用于文件的更新和回溯。
- pr:可以为文档添加一些特殊设置,如表头,页码。
正则表达式符号纵览
- ^word:word处于行首。
- word$:word处于行尾。
- .:一定有一个任意字符。
- \:转义字符。
- *:重复零到无穷个前一个RE表达式
- [list]:字符集合中选一个字符。
- [n1-n2]:n1到n2中选一个字符,收到系统语言编码的影响。
- [^list]:不选该集合中的字符。
- {n,m}:连续n到m个前一个RE表达式。
- +:重复一个及以上前一个RE表达式。
- ?:零个或一个前一个RE表达式。
- |:表示或的关系。
- ():表示字符串的集合中选择一个字符串。