文本搜索必学命令-grep用法以及正则表达式

Linux系统中grep命令是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。grep全称是Global Regular Expression Print，表示全局正则表达式版本，它的使用权限是所有用户。

语法格式：

grep [option]........ 'PATTERN' FILE..

（１）grep搜索字符串 [filename]
（２）正则表达式 [filename]

在文件中搜索所有 pattern 出现的位置,pattern 既可以是要搜索的字符串,也可以是一个正则表达式.

注意：在输入要搜索的字符串时最好使用双引号/而在模式匹配使用正则表达式时，注意使用单引号

命令选项：

-v:反向选取

　 -o:仅显示配的字串，而非字串所在的行

　 -i：innore-case,忽略字符大小写

-E:支持使用扩展正则表达式

-A：显示匹配到字符那行的后面n行

-B：显示匹配到字符那行的前面n行

-C：显示匹配到字符那行的前后n行

pattern正则表达式主要参数：
\：忽略正则表达式中特殊字符的原有含义。
^：匹配正则表达式的开始行。
$: 匹配正则表达式的结束行。
\<：从匹配正则表达式的行开始。
\>：到匹配正则表达式的行结束。
[ ]：单个字符，如[A]即A符合要求。
[ - ]：范围，如[A-Z]，即A、B、C一直到Z都符合要求。
．：所有的单个字符。
* ：有字符，长度可以为0。

. *:任意长度的任意字符

字符匹配：@H_403_154@

@H_403_154@[0-9],[[:digit:]] @H_403_154@表示数字

@H_403_154@ [a-z],[[:lower:]] 表示所有的小写字母

@H_403_154@ [A-Z],[[:upper:]] 表示所有的大写字母

@H_403_154@ [[:space:]] 表示空白字符

@H_403_154@ [[:punct:]] @H_403_154@特殊字符

@H_403_154@ [[:alpha:]] @H_403_154@大小写字母

@H_403_154@ [[:alnum:]] @H_403_154@字母数字

正则表达式

正则表达使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里，正则表达式通常被用来检索、替换那些符合某个模式的文本。简而言之，正则表达式就是处理字符串的方法，以行为单位进行字符串的处理，通过一些特殊符号的辅助，可以让用户轻松搜索/替换某特定的字符串。

正则表达式分为两类：基本的正则表达式和扩展的正则表达式。

基本的正则表达式：

１．元字符：

.:匹配任意单个字符

例如：查找包含student且后面带一个字符的行

grep‘student.’/etc/passwd //模式可以用单引号和双引号，如果模式中要做变量替换时则必须用双引

[]:匹配指定范围内的任意单个字符,[abc],[a-z],[0-9],[a-zA-Z]

例如：查找带有数字的行

grep‘[0-9]’/etc/passwd

[^]:匹配指定范围外的任意单个字符

例如：查找没有小写字母的行。

grep‘[^a-z]’/etc/inittab

２．次数匹配：

*:匹配其前面的字符任意次

例如：查找root出现0次或0次以上的行

grep‘root*’/etc/passwd

.*:任意字符

例如：查找包含root的行

grep'root.*'/etc/passwd

\?：匹配其前面的字符1次或0次

\{m,n\}:匹配其前字符最少m，最多n次）

３．字符锚定：

^:锚定行首，此字符后面的任意内容必须出现在行首

例如：查找行首以#开头的行

grep'^#'/etc/inittab

$:锚定行尾，此字符前面的任意内容必须出现在行尾

例如：查找行首以root结尾的行

grep'root$'/etc/inittab

^$:锚定空白行，可以统计空白行

\<或者\b:锚定词首，其后面的任意字符必须做为单词首部出现

例如：查找root且root前面不包含任何字符的行

grep'\<root'/etc/man.config

>\b:锚定词尾，其前面的任意字符必须做为单词尾部出现

例如：\<root\>查找root单词grep"\>"=grep"\broot\b"

扩展的正则表达式：

扩展的正则表达只是在基本的正则表达上作出了小小的一点修改，其修改如下：

在扩展的正则表达中把 写成()、\{ \} 写成{ }，另外加入了+：次数匹配，匹配其前面的字符至少出现一次，无上限、|: 或者(二取一），其余的都一样，基本正则表达式，使用( ) { } . ? |都需要转义,在扩展正则表达中不需要加\，其详细信息如下：

(1) 字符匹配

.@H_403_154@：匹配任意字符

[ ]@H_403_154@：指定范围内的字符

[^]@H_403_154@：匹配指定范围外的任意单个字符

(2) 次数匹配：

*:匹配其前面字符的任意次

？:匹配其前面字符的0此或1次

+:匹配其前面字符至少1次

例如：至少一个空白符：'[[:space:]]+'

{m,n}:匹配其前面字符m到n次

grep 的具体实例

@H_403_154@1、显示/proc/meminfo文件中以大写或小写s开头的行

@H_403_154@# grep -i '^s' /proc/meminfo

# grep '^[Ss]' /proc/meminfo

@H_403_154@2、显示/etc/passwd文件中其默认shell为非/sbin/nologin 的用户

#grep -v "/sbin/nologin$" /etc/passwd | sort -d: -f1

@H_403_154@3、显示/etc/passwd文件中其默认shwll为/bin/bash的用户

进一步：显示上述结果中其ID号最大的用户

#grep "/bin/bash$" /etc/passwd | sort -t:-k3 -n | tail -1 |cut -d: -f1

@H_403_154@4、找出/etc/passwd文件中的一位数或两位数

#grep "\<[0-9][0-9]\?\>"/etc/passwd

#grep "\<[0-9]\{1,2\}\>"/etc/passwd

@H_403_154@5、显示/boot.grub/grub.conf中以至少一个空白字符开头的行

# grep "^[[:space:]]\{1,\}"/boot/grub/grub.conf

@H_403_154@6、显示/etc/rc.d/rc.sysinit文件中，以#开头，后面跟一个个空白字符，而后以在至少一非空白的行

#grep "^#[[:space:]]\{1,\}[^[:space:]]\{1,\}"/etc/rc.d/rc.sysinit

@H_403_154@7、找出netstat - tan命令执行结果中以‘LISTEN’结尾的行

# netstat -tan | grep "LISTEN[[:SPACE:]]*$"

@H_403_154@8、添加用户bash,testbash,basher,nologin(SHELL为/sbin/nologing)而找出当前系统上其用户名和默认shell相同的用户

#grep "^$[[:alnum:]]\{1,\}$:.*\1$"/etc/passwd

@H_403_154@9、扩展题：新建一个文本文件，假设胡如下内容

He like his lover

He love his lover

He like his liker

He love his liker

找出其中最后人个单词是由此前某单词加r构成的行

#grep "$l..e$.*\1r" b.txt

@H_403_154@10、显示当前系统上root、fedora或user1用户的默认shell

#gerp -E "^(root|fedora|user1)" /etc/passwd |cut -d: -f7

@H_403_154@11、找出/etc/rc.d/init.d/functions文件中某单词后跟一组小括号“（）”行

#grep -o -E "\<[[:alnum:]]+\>"/etc/rc.d/init.d/functions

@H_403_154@12、使用echo命令输出一个路径，而后使用grep取出基名

echo/etc/sysconfig |grep

#echo "/etc/sysconfig " |grep -o -E"[^/]/?$"

@H_403_154@13、找出ifconfig 命令结果中的1-255之间的数字

#ifconfig | grep -o -E "\<([1-9] | [1-9] [0-9])|1[0-9][0-9] |2[0-4][0-9]|25[0-5])\>"

原文链接：https://www.f2er.com/regex/360266.html

文本搜索必学命令-grep用法以及正则表达式

基本的正则表达式：

扩展的正则表达式：

猜你在找的正则表达式相关文章