RE字符 | 意义与范例 | ^word意义:待搜寻的字串(word)在行首! 范例:搜寻行首为#开始的那一行,并列出行号grep-n‘^#’regular_express.txt
|
word$意义:待搜寻的字串(word)在行尾! 范例:将行尾为!的那一行列印出來,并列出行号grep-n‘!$’regular_express.txt
|
.意义:代表『一定有一个任意字元』的字符! 范例:搜寻的字串可以是(eve)(eae)(eee)(ee),但不能仅有(ee)!亦即e与e中间『一定』仅有一个字元,而空白字元也是字元!grep-n‘e.e’regular_express.txt
|
\意义:跳脱字符,将特殊字符的特殊意义去除! 范例:搜寻含有单引号‘的那一行!grep-n\’regular_express.txt
|
*意义:重复零个到无穷个的前一个字符 范例:找出含有(es)(ess)(esss)等等的字串,注意,因为*可以是0個,所以es也是符合的。另外,因为*为重复『前一个字符』的符号,因此,在*之前必须要紧接着一个字符喔!例如任意字元則为『.*』!grep-n‘ess*’regular_express.txt
|
[list]意義:字元集合的RE字符,裡面列出想要擷取的字元! 范例:搜尋含有(gl)或(gd)的那一行,需要特別留意的是,在[]當中『謹代表一個待搜尋的字元』,例如『a[afl]y』代表搜尋的字串可以是aay,afy,aly即[afl]代表a或f或l的意思!grep-n‘g[ld]‘regular_express.txt
|
[n1-n2]意义:字元集合里,列出想要撷取的字元范围! 范例:搜寻含有任意数字的那一行!需特別留意,在字元集合[]中的减号–是有特殊意义的,他代表两个字元之间的所有连续字元!但这个连续与否与ASCII编码有关,因此,你的编码需要设定正确(在bash当中,需要确定LANG与LANGUAGE的变量是否正确!)例如所有大写字元則为[A-Z]grep-n‘[A-Z]‘regular_express.txt
|
[^list]意义:字元集合的RE字符,里面列出不要的字串或范围! 范例:搜寻的字串可以是(oog)(ood)但不能是(oot),那个^在[]內时,代表的意义是『反向选择』的意思。例如,我不要大写字元,则为[^A-Z]。但是,需要特別注意的是,如果以grep-n[^A-Z]regular_express.txt來搜寻,卻发现该文件內的所有行都被列出,为什么?因为这个[^A-Z]是『非大写字元』的意思,因为每一行均有非大写字元,例如第一行的OpenSource就有p,e,n,o.等等的小写字grep-n‘oo[^t]‘regular_express.txt
|
\{n,m\}意义:连续n到m个的『前一个RE字符』 意义:若为\{n\}则是连续n个的前一个RE字符, 意义:若是\{n,\}則是连续n个以上的前一个RE字符! 范例:在g与g之间有2个到3个的o存在的字串,亦即(goog)(gooog)grep-n‘go\{2,3\}g’regular_express.txt
|
====分析工具sed====
sed本身是一个管道命令,可以分析stdin数据
#sed[-nefr][动作]
-n:使用安静模式(silent),在一般模式下,所有来自stdin数据都显示出来,而-n后只显示被sed特殊处理的那一行
-e:直接在命令行模式上进行sed的动作编辑
-f:直接将sed动作写在一个文件内,-ffilename则可以执行filename内的sed动作
-r:sed的动作支持的是扩展型正则式语法(默认是基础型)
-i:直接修改读取的文件内容,而不是由屏幕输出
动作说明:[n1[,n2]]function
n1,n2:不见得存在,一般代表选择进行动作的行数,比如在10到20行间进行,则10,20[动作行为]‘
function的参数:
a:新增,a的后面可以接字符串,而这些字符串会在新的一行出现(目前的下一行)
c:替换,c的后面接字符串,这些字符串可以替换n1,n2之间的行
d:删除,后面不接任何参数
i:插入,i后面可接字符串,这些字符串会在新的一行出现(目前的上一行)
p:打印,也就是将某个选择的数据打印出来。通常p会与参数sed-n一起运行
s:替换,就是直接进行替换工作,通常这个s的动作可以搭配正则式例如:1,29s/old/new/g就是
注:sed后面接的动作,需要用两个单引号括住。
#nl/etc/passwd|sed’2,5d’
#nl/etc/passwd|sed’3,$d’
整行替换:
#nl/etc/passwd|sed’2,5cNo2-5number’
#nl/etc/passwd|sed-n’5,7p’这个等价于:head-n7|tail-n5
sed的查找并替换,跟vim的很类似:
#sed‘s/要被替换的字符串/新的字符串/g’
#nl/etc/passwd|sed‘/^$/d’<==删除空白行
====扩展正则式====
====好用的数据处理工具awk====
相比于sed常常作用于一整行的处理,awk则运用于将一行分成数个字段来处理,适用于处理小型数据
#awk‘条件类型1{动作1}条件类型2{动作2}’filename
#awk-n5|awk‘{print$t\t$3}’
awk处理流程:
1,读入第一行,并将第一行的数据填入$0,$1,$2等变量中
2,依据条件类型限制,判断是否需要进行后面的动作
3,做完所有的动作与条件类型
4,若还有后续的行的数据,则重复上面的1~3的步骤,直到所有的数据都读完为止
awk的内置变量为:
*NF:每一行($0)拥有的字段总数
*NR:目前awk所处理的是第几行数据
*FS:目前的分隔符,默认是空格键
#last-n5|awk‘{print$1\tlines:NR\tcolumns:NF}’
#cat/etc/passwd|awk‘BEGIN{FS=:}$3<10{print$1\t$3}’
====文件的比较命令diff====
#diff[-bBi]original_filenew_file
-b:忽略一行中仅有多个空白的区别
-B:忽略空白行的区别
-i:忽略大小写的不同
====补丁命令patch====
先用diff命令生成补丁文件:
#diff-Naurpasswd.oldpasswd.new>paswd.patch
#patch-pN<patch_file<==更新
#patch-R-pN<patch_file<==还原
-p:后面的N表示取消基层目录的意思
-R:代表还原,将新的文件还原成原本的旧的版本
再开始把旧文件升级到新版本:
#patch-p0<passwd.patch
把新版本还原:
#patch-R-p0<passwd.patch
打印命令pr.
============END===============