awk截取字符串

分隔字符串分三种情况，一种是分隔符是空格，一种是非空格，还有一种是多个字符作为分隔符

先来创建一个文件吧：

[plain]view plaincopy 
    
 Nam   Chinese     Math       English  
 Tom      80        90           100  
 Jack     83        88           90  
 Lilei    84        80           88  

注意：这个文件是用空格分隔的，所以字段之间的空格数目不一样

我们想要查看每个人的English成绩，则可以用

[plain]view plaincopy 
    
 awk '{print $1 "\t" $4}' student.txt   

可以看到，最后全部列出了所有人的English成绩，由此可见，在使用空格分隔是，连续的空格会当做一个分隔符来处理，那么对于别的分隔符呢？我们来看看

首先来看看指定分隔符的用法：

将文件修改成用：分隔

[plain]view plaincopy 
    
 Nam:Chinese:Math:English  
 Tom:80:90:100  
 Jack:83:88:90  
 Lilei:84:80:88  

然后执行

[plain]view plaincopy 
    
 awk -F ':' '{print $1"\t"$4}' student.txt  

可见，和上面输出是一样的，所以可以通过 -F来指定分隔符，除此之外，FS也可以指定分隔

[plain]view plaincopy 
    
 awk '{FS=":"} {print $1 "\t" $4}' student.txt  

输出结果：

成绩是输出了，但是名字好像没有被分隔，事实上，awk的用法是 awk '条件1{动作1} 条件2{动作2}' 文件名，但是在执行这些动作的时候已经把行读取了，所以应该在读取之前就指定分隔符，所以用BEGIN

[plain]view plaincopy 
    
 awk 'BEGIN {FS=":"} {print $1 "\t" $4}' student.txt  

最后结果也一样，所以说在指定分隔符的时候可以用-F也可以用FS，需要注意的是用FS时要加上BEGIN。好了，回到前面，当有多个非空格分隔符呢？来试试，把文件修改成如下：

[plain]view plaincopy 
    
 Nam::Chinese::Math::English  
 Tom::80::90::100  
 Jack::83::88::90  
 Lilei::84::80::88  

然后执行

[plain]view plaincopy 
    
 awk -F ':' '{print $1 "\t" $4}' student.txt  

可以看到，并没有输出我们想要的结果！

那就是试试::

[plain]view plaincopy 
    
 awk -F '::' '{print $1 "\t" $4}' student.txt  

这次得到了想要的输出，由此可见，在只用空格作为分隔符是，中间的多个空格都会当做一个分隔来处理，当使用别的空格符是，指定几个分隔符就按几个来分隔。

所以这里我们可以使用简单的正则来处理：

正则中 * 表示前面的字符出现任意次（包含0），所以在有多个分隔符时我们可以用*开匹配：

[plain]view plaincopy 
    
 awk -F ':*' '{print $1 "\t" $4}' student.txt  

这就是说分隔符是 : 或是 :: 或是 ::: 或是::::等等

最后得到了正确的输出

既然可以用正则，那就可以使用多个不同的分隔符，将文件改成如下：

[plain]view plaincopy 
    
 Nam:/Chinese:;Math<>>>>English  
 Tom/80/90::100  
 Jack/83/88<>90  
 Lilei::84::80<<<88  

然后执行

[plain]view plaincopy 
    
 awk -F '[:/;<>]*' '{print $1 "\t" $4}' student.txt  

好吧，很黄很暴力，但结果确实是正确的！

除此之外，awk还可以用substr来截取字符串，如下截取日期：

[plain]view plaincopy 
    
 #!/usr/bin/bash  
   
 date=`date +%Y%m%d`  
   
 year=`echo $date | awk '{print substr($date, 0, 4)}'`  
 month=`echo $date | awk '{print substr($0, 5, 2)}'`  
 day=`echo $date | awk '{print substr($date, 7, 2)} '`  
 echo $date  
 echo $year  
 echo $month  
 echo $day  

这里有用到了两个函数，date和awk substr，date用来获取日期，其余的用法还有

获取明天的日期
date -d next-day +%Y%m%d

获取昨天的日期
date -d last-day +%Y%m%d

获取上个月的年和月
date -d last-month +%Y%m

获取下个月的年和月
date -d next-month +%Y%m

获取明年的年份
date -d next-year +%Y

在获取非当前日期时需要加上-d参数，另外还可以指定时分秒

比如：echo `date +%Y%m%d-%H:%M:%S`，在格式化日期的时候只有月和日是小写，其余都是大写。

awk中常用的函数：

猜你喜欢