文章目录

一、sort命令
二、uniq命令
三、cut命令
四、sed命令
五、awk命令
六、wc命令

一、sort命令

sort命令对File参数指定的文件中的行排序，并将结果写到标准输出。
如果File参数指定多个文件，那么sort命令会将这些文件连接起来，并当做一个文件进行排序。

语法：
sort [-fbMnrtuk] [file or stdin]

选项与参数：
-f：忽略大小写差异，a和A视为相同
-b：忽略最前面的空格
-M：以月份的名字来排序，例如JAN、DEC等排序方法
-n：使用纯数字进行排序（默认是以文字的字典顺序来排序）
-r：反向排序
-t：分隔符，默认是以Tab键来分割
-u：去重
-k：使用哪一列进行排序（默认使用第1列进行排序）

示例：

示例	示例说明
cat /etc/passwd \|sort	对/etc/passwd文件的用户名进行升序排序
cat /etc/passwd \|sort -t “:” -k 3	对/etc/passwd文件使用第3列进行升序排序
cat /etc/passwd \|sort -t “:” -k 3n	对/etc/passwd文件使用第3列以数字顺序进行升序排序
cat /etc/passwd \|sort -t “:” -k 3nr	对/etc/passwd文件使用第3列以数字顺序进行降序排序
cat /etc/passwd \|sort -t “:” -k 6.2,6.4 -k 1r	对/etc/passwd文件，先以第6列的第2到4个字符进行升序排序，然后再以第1列进行降序排序
cat /etc/passwd \|sort -t “:” -k 7 -u	对/etc/passwd文件使用第7列进行升序排序并去重

二、uniq命令

uniq可以去除排序过的文件中的重复行。因此uniq经常和sort合用，为了使uniq起作用，重复行必须是相邻的。

语法：
uniq [-icu]

选项与参数：
-i：忽略大小写
-c：进行技术
-u：只显示唯一的行（不加参数时的默认值）

示例：

示例	示例说明
cat testfile \| sort \| uniq	对testfile进行去重（去重之前必须要先排序）
cat testfile \| sort \| uniq -c	统计testfile文件行的重复次数

三、cut命令

cut命令可以从文本文件或文本流中提取文本列。
示例：

示例	示例说明
wc -c test \| cut -d ’ ’ -f 1	以’ '为分隔符，只取第1列
echo $PATH \| cut -d ‘:’ -f 3,5	以’: '为分隔符，取第3列和第5列
echo $PATH \| cut -d ‘:’ -f 3-5	以’: '为分隔符，取3到5列
echo $PATH \| cut -d ‘:’ -f 3-5,7	以’: '为分隔符，取3到5列和第7列
echo $PATH \| cut -d ‘:’ -f 3-	以’: '为分隔符，取3到最后一列

四、sed命令

sed是一个很好的文件处理工具，本身是一个管道命令，主要是以行为单位进行处理，可以将数据行进行替换、删除、新增、选取等特定工作。

语法：
sed [-nefri] [-e

参数说明：
-n∶使用安静(silent)模式。在一般 sed 的用法中，所有来自标准输入的内容都会被输出到屏幕上。如果加上 -n 参数后，则只输出经过sed 处理的行。
-e

动作说明：
a∶新增， a 的后面可以接字串，而这些字串会在新的一行出现(当前行的下一行)；
c∶取代， c 的后面可以接字串，这些字串可以取代 n1,n2 之间的行；
d∶删除，因为是删除啊，所以 d 后面通常不接任何咚咚；
i∶插入， i 的后面可以接字串，而这些字串会在新的一行出现(当前行的上一行)；
p∶打印，亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起运作；
s∶替换，将特定的字符串替换成新的字符串！通常这个 s 的动作可以搭配正则表达式！例如 1,20s/old/new/g 就是啦！

示例：（假设我们有一文件名为ab）
删除行：

示例	示例说明
sed ‘1d’ testfile	删除testfile文件第1行
sed ‘1,3d’ testfile	删除testfile文件第1行到第3行
sed ‘$d’ testfile	删除testfile文件最后一行
sed ‘3,$d’ testfile	删除testfile文件第3行到最后一行
sed '/test/'d testfile	按照模式进行删除，删除testfile文件所有包含test的行

显示特定行

示例	示例说明
sed -n ‘1p’ testfile	显示第1行
sed -n ‘$p’ testfile	显示最后一行
sed -n ‘1,3p’ testfile	显示第1行到第3行
sed -n ‘3,$p’ testfile	显示第3行到最后一行

使用模式进行查询

示例	示例说明
sed -n ‘/ruby/p’ testfile	查询包含关键字ruby的所有行
sed -n ‘/\$/p’ testfile	查询包括关键字$所在所有行，必须使用反斜杠\来转义特殊字符$

插入行

示例	示例说明
sed ‘1a drink tea’ testfile	在第1行后增加字符串"drink tea"
sed ‘1,3a drink tea’ testfile	第1行到第3行后增加字符串"drink tea"
sed -i ‘$a bye’ testfile	在testfile文件最后一行插入"bye"
sed ‘1a drink tea\nor coffee’ testfile	第1行后增加2行，中间必须使用换行符\n进行分割

替换整行

示例	示例说明
sed ‘1c Hi’ testfile	第1行代替为Hi
sed ‘1,3c Hi’ testfile	第1行到第3行代替为Hi

替换行的一部分
语法：
sed ‘s/要替换的字符串/新的字符串/g’ （要替换的字符串可以用正则表达式）

示例	示例说明
sed ‘s/ruby/bird/g’ testfile	把字符串ruby替换为bird
sed -n ‘/ruby/p’ testfile \| sed ‘s/ruby/bird/g’	把字符串ruby替换为bird
sed -n ‘/ruby/p’ testfile \| sed ‘s/ruby//g’	删除每一行中的ruby字符串
sed -n ‘s/^127.0.0.1/&localhost/’ testfile	在字符串127.0.0.1后面添加localhost
sed -n ‘s/(love)able/\1rs/’ testfile	将love进行分组，将分组1后面的able替换为rs

五、awk命令

awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息。
awk处理过程: 依次对每一行进行处理，然后输出。
awk命令形式:

awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file

参数说明：
–F：指定分隔符
-f：调用脚本
-v：定义变量 var=value
’ ’ ：引用代码块
BEGIN 初始化代码块，在对每一行进行处理之前，初始化代码，主要是引用全局变量，设置FS分隔符
// ：匹配代码块，可以是字符串或正则表达式
{} ：命令代码块，包含一条或多条命令
；：多条命令使用分号分隔
END 结尾代码块，在对每一行进行处理之后再执行的代码块，主要是进行最终计算或输出结尾摘要信息。

特殊要点:


$0	表示整个当前行
$1	每行第一个字段
NF	字段数量变量
NR	每行的记录号，多文件记录递增
FNR	与NR类似，不过多文件记录不递增，每个文件都从1开始
\t	制表符
\n	换行符
FS	BEGIN时定义分隔符
RS	输入的记录分隔符，默认为换行符(即文本是按一行一行输入)
~	匹配，与==相比不是精确比较
!~	不匹配，不精确比较
==	等于，必须全部相等，精确比较
!=	不等于，精确比较
&&	逻辑与
\|\|	逻辑或
+	匹配时表示1个或1个以上
/[0-9][0-9]+/	两个或两个以上数字
/[0-9][0-9]*/	一个或一个以上数字
FILENAME	文件名
OFS	输出字段分隔符，默认也是空格，可以改为制表符等
ORS	输出的记录分隔符，默认为换行符,即处理结果也是一行一行输出到屏幕
-F’[:#/]’	定义三个分隔符冒号（:）、井号（ # ）和斜杠（ /）

print：是awk打印指定内容的主要命令。

命令	说明
awk ‘{print}’ /etc/passwd 或 awk ‘{print $0}’ /etc/passwd	逐行输出/etc/passwd文件的内容
awk '{if($3>30000){print $1" “$2” “$3”}} tomcat.log	过滤出第四列>30000的行，并只打印2、3、4列
awk ‘{print " "}’ /etc/passwd	不输出/etc/passwd文件的内容，而是输出相同行数的空行
awk ‘{print “a”}’ /etc/passwd	不输出/etc/passwd文件的内容，而是输出相同行数的a行，每行就只有一个字母a
awk -F":" ‘{print $1}’ /etc/passwd	只输出第一列
awk -F: ‘{print $1; print $2}’ /etc/passwd	输出第1列和第2列
awk -F: ‘{print $1,$3,$6}’ OFS="\t" /etc/passwd	输出1,3,6列，并以制表符作为分隔符

-f：指定脚本文件

awk -f script.awk  file
BEGIN{
FS=":"
}
{print $1}

说明：效果与awk -F":" '{print $1}'相同,只是分隔符使用FS在代码自身中指定

awk 'BEGIN{X=0} /^$/{ X+=1 } END{print "I find",X,"blank lines."}' test

结果：I find 4 blank lines.

ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is",sum}'

计算文件大小：total size is 17487

-F指定分隔符
$1 是按照指定分隔符分割后的第一个字段，$3指第三个字段。
\t是制表符，一个或多个连续的空格或制表符看做一个定界符，即多个空格看做一个空格。

示例：

命令	说明
awk -F":" ‘{print $1}’ /etc/passwd	输出$1
awk -F":" ‘{print $1 $3}’ /etc/passwd	$1与$3相连输出，不分隔
awk -F":" ‘{print $1,$3}’ /etc/passwd	多了一个逗号，$1与$3使用空格分隔
awk -F":" ‘{print $1 " " $3}’ /etc/passwd	$1与$3之间手动添加空格分隔
awk -F":" ‘{print “Username:” $1 “\t\t Uid:” $3 }’ /etc/passwd	自定义输出
awk -F: ‘{print NF}’ /etc/passwd	显示每行有多少字段
awk -F: ‘{print $NF}’ /etc/passwd	将每行第NF个字段的值打印出来
awk -F: ‘NF==4 {print }’ /etc/passwd	显示只有4个字段的行
awk -F: ‘NF>2{print $0}’ /etc/passwd	显示每行字段数量大于2的行
awk ‘{print NR,$0}’ /etc/passwd	在每行内容前面添加行号
awk -F: ‘{print NR,NF,$NF,"\t",$0}’ /etc/passwd	依次打印行号，字段数，最后字段值，制表符，每行内容
awk -F: ‘NR==5{print}’ /etc/passwd	显示第5行
awk -F: ‘NR==5 \|\| NR==6{print}’ /etc/passwd	显示第5行和第6行
route -n\|awk ‘NR!=1{print}’	不显示第一行

匹配代码块
//：纯字符匹配
!//：纯字符不匹配
~//：字段值匹配
!~//：字段值不匹配
~/a1|a2/字段值匹配a1或a2

示例：

命令	说明
awk ‘/mysql/’ /etc/passwd	输出匹配mysql的行
awk ‘/mysql/{print }’ /etc/passwd	输出匹配mysql的行
awk ‘/mysql/{print $0}’ /etc/passwd	输出匹配mysql的行
awk ‘!/mysq\l/{print $0}’ /etc/passwd	输出不匹配mysql的行
awk ‘/mysql\|mail/{print}’ /etc/passwd	输出匹配mysql或mail的行
awk ‘!/mysql\|mail/{print}’ /etc/passwd	输出不匹配mysql和mail的行
awk -F: ‘/mail/,/mysql/{print}’ /etc/passwd	区间匹配，输出匹配mail和mysql之间的字符串的行
awk ‘/[2][7][7]*/{print $0}’ /etc/passwd	匹配包含27为数字开头的行，如27，277，2777…
awk -F: ‘$1~/mail/{print $1}’ /etc/passwd	$1匹配指定内容才显示
awk -F: ‘{if($1~/mail/) print $1}’ /etc/passwd	与上面相同
awk -F: ‘$1!~/mail/{print $1}’ /etc/passwd	$1不匹配mail时才显示
awk -F: '$1!~/mail	mysql/{print $1}’ /etc/passwd

IF语句
必须用在{}中，且比较内容用()扩起来。

示例：

命令	说明
awk -F: ‘{if($1~/mail/) print $1}’ /etc/passwd	简写
awk -F: ‘{if($1~/mail/) {print $1}}’ /etc/passwd	全写
awk -F: ‘{if($1~/mail/) {print $1} else {print $2}}’ /etc/passwd	if…else…

条件表达式
==：等于
!=：不等于
> ：大于
>= :大于
示例：

命令	说明
awk -F":" ‘$1==“mysql”{print $3}’ /etc/passwd	等于
awk -F":" ‘{if($1==“mysql”) print $3}’ /etc/passwd	同上
awk -F":" ‘$1!=“mysql”{print $3}’ /etc/passwd	不等于
awk -F":" ‘$3>1000{print $3}’ /etc/passwd	大于
awk -F":" ‘$3>=100{print $3}’ /etc/passwd	大于等于
awk -F":" ‘$3<1{print $3}’ /etc/passwd	小于
awk -F":" ‘$3<=1{print $3}’ /etc/passwd	小于等于

逻辑运算符
&& 和 ||

示例：

命令	说明
awk -F: ‘$1~/mail/ && $3>8 {print }’ /etc/passwd	逻辑与，$1匹配mail，并且$3>8
awk -F: ‘{if($1~/mail/ && $3>8) print }’ /etc/passwd	同上
awk -F: ‘$1~/mail/ \|\| $3>1000 {print }’ /etc/passwd	逻辑或
awk -F: ‘{if($1~/mail/ \|\| $3>1000) print }’ /etc/passwd	同上

数值运算
示例：

命令	说明
awk -F: ‘$3 > 100’ /etc/passwd	输出’$3 > 100的行
awk -F: ‘$3 > 100 \|\| $3 < 5’ /etc/passwd	输出’$3 > 100或$3 < 5的行
awk -F: ‘$3+$4 > 200’ /etc/passwd	输出$3+$4 > 200的行
awk -F: ‘/mysql\|mail/{print $3+10}’ /etc/passwd	第三个字段加10打印
awk -F: ‘/mysql/{print $3-$4}’ /etc/passwd	减法
awk -F: ‘/mysql/{print $3*$4}’ /etc/passwd	求乘积
awk ‘/MemFree/{print $2/1024}’ /proc/meminfo	除法
awk ‘/MemFree/{print int($2/1024)}’ /proc/meminfo	取整

输出分隔符OFS

示例：

命令	说明
awk ‘$6 ~ /FIN/ \|\| NR==1 {print NR,$4,$5,$6}’ OFS="\t" netstat.txt
awk ‘$6 ~ /WAIT/ \|\| NR==1 {print NR,$4,$5,$6}’ OFS="\t" netstat.txt	输出字段6匹配WAIT的行，其中输出每行行号，字段4,5,6，并使用制表符分割字段

输出处理结果到文件

示例：

命令	说明
route -n\|awk ‘NR!=1{print > “./fs”}’	在命令代码块中直接输出
route -n\|awk ‘NR!=1{print}’ > ./fs	使用重定向进行输出

格式化输出

netstat -anp\|awk '{printf "%-8s %-8s %-10s\n",$1,$2,$3}'

printf：表示格式输出
%：格式化输出分隔符
-8：长度为8个字符
s：表示字符串类型
打印每行前三个字段，指定第一个字段输出字符串类型(长度为8)，第二个字段输出字符串类型(长度为8)，第三个字段输出字符串类型(长度为10)

netstat -anp|awk '$6=="LISTEN" || NR==1 {printf "%-10s %-10s %-10s \n",$1,$2,$3}'
netstat -anp|awk '$6=="LISTEN" || NR==1 {printf "%-3s %-10s %-10s %-10s \n",NR,$1,$2,$3}'

IF语句

awk -F: ‘{if($3>100) print “large”; else print “small”}’ /etc/passwd
awk -F: ‘BEGIN{A=0;B=0} {if($3>100) {A++; print “large”} else {B++; print “small”}} END{print A,"\t",B}’ /etc/passwd //ID大于100,A加1，否则B加1
awk -F: ‘{if($3<100) next; else print}’ /etc/passwd //小于100跳过，否则显示
awk -F: ‘BEGIN{i=1} {if(i<NF) print NR,NF,i++ }’ /etc/passwd
awk -F: ‘BEGIN{i=1} {if(i<NF) {print NR,NF} i++ }’ /etc/passwd
另一种形式
awk -F: ‘{print ($3>100 ? “yes”:“no”)}’ /etc/passwd
awk -F: ‘{print ($3>100 ? $3":\tyes":$3":\tno")}’ /etc/passwd

while语句

awk -F: 'BEGIN{i=1} {while(i<NF) print NF,$i,i++}' /etc/passwd

结果：
7 root 1
7 x 2
7 0 3
7 0 4
7 root 5
7 /root 6

数组

netstat -anp|awk 'NR!=1{a[$6]++} END{for (i in a) print i,"\t",a[i]}'
netstat -anp|awk 'NR!=1{a[$6]++} END{for (i in a) printf "%-20s %-10s %-5s \n", i,"\t",a[i]}'

结果：
9523 1
9929 1
LISTEN 6
7903 1
3038/cupsd 1
7913 1
10837 1
9833 1

应用1：
awk -F: ‘{print NF}’ helloworld.sh //输出文件每行有多少字段
awk -F: ‘{print $1,$2,$3,$4,$5}’ helloworld.sh //输出前5个字段
awk -F: ‘{print $1,$2,$3,$4,$5}’ OFS=’\t’ helloworld.sh //输出前5个字段并使用制表符分隔输出
awk -F: ‘{print NR,$1,$2,$3,$4,$5}’ OFS=’\t’ helloworld.sh //制表符分隔输出前5个字段，并打印行号

应用2：
awk -F’[:#]’ ‘{print NF}’ helloworld.sh //指定多个分隔符: #，输出每行多少字段
awk -F’[:#]’ ‘{print $1,$2,$3,$4,$5,$6,$7}’ OFS=’\t’ helloworld.sh //制表符分隔输出多字段

应用3：
awk -F’[:#/]’ ‘{print NF}’ helloworld.sh //指定三个分隔符，并输出每行字段数
awk -F’[:#/]’ ‘{print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$11,$12}’ helloworld.sh //制表符分隔输出多字段

应用4：
计算/home目录下，普通文件的大小，使用KB作为单位

 ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is:",sum/1024,"KB"}'

计算/home目录下，普通文件的大小，使用KB作为单位，int是取整的意思

ls -l|awk 'BEGIN{sum=0} !/^d/{sum+=$5} END{print "total size is:",int(sum/1024),"KB"}'

应用5：
统计netstat -anp 状态为LISTEN和CONNECT的连接数量分别是多少

netstat -anp|awk '$6~/LISTEN|CONNECTED/{sum[$6]++} END{for (i in sum) printf "%-10s %-6s %-3s \n", i," ",sum[i]}'

应用6：
统计/home目录下不同用户的普通文件的总数是多少？

ls -l|awk 'NR!=1 && !/^d/{sum[$3]++} END{for (i in sum) printf "%-6s %-5s %-3s \n",i," ",sum[i]}'

结果：
mysql 199
root 374

统计/home目录下不同用户的普通文件的大小总size是多少？

ls -l|awk 'NR!=1 && !/^d/{sum[$3]+=$5} END{for (i in sum) printf "%-6s %-5s %-3s %-2s \n",i," ",sum[i]/1024/1024,"MB"}'

应用7：
输出成绩表

awk 'BEGIN{math=0;eng=0;com=0;printf "Lineno.   Name    No.    Math   English   Computer    Total\n";printf "------------------------------------------------------------\n"}{math+=$3; eng+=$4; com+=$5;printf "%-8s %-7s %-7s %-7s %-9s %-10s %-7s \n",NR,$1,$2,$3,$4,$5,$3+$4+$5} END{printf "------------------------------------------------------------\n";printf "%-24s %-7s %-9s %-20s \n","Total:",math,eng,com;printf "%-24s %-7s %-9s %-20s \n","Avg:",math/NR,eng/NR,com/NR}' test0

结果：
cat test0
Marry 2143 78 84 77
Jack 2321 66 78 45
Tom 2122 48 77 71
Mike 2537 87 97 95
Bob 2415 40 57 62

六、wc命令

输出每个指定文件的行数、单词计数和字节数。如果指定了多个文件，则输出所有文件的总计，如果没有指定文件或指定文件为“-”，则从标准输入读取数据。

Linux常用文本处理工具