笔记:Linux 文件的排序、合并和分割

版权声明: https://blog.csdn.net/u012204535/article/details/83120124
  1. fsort命令
    sort命令的基本格式:
sort [选项] [输入文件]

例如:

查看/etc/passwd 文件的内容
cat /etc/passwd

在这里插入图片描述

以默认方式对/etc/passwd文件排序
sort -t: /etc/passwd

在这里插入图片描述
2. uniq命令
uniq命令用于去除文本文件中的重复行,类似于sort命令的-u选项,但是,uniq命令和sort -u是存在一些区别的,请看示例:
在这里插入图片描述

cat w			#查看w文件的内容
uniq w			#用uniq命令去除重复行,相邻重复行去除
sort -u w 		#用sort -u去除重复行,所有重复行都去除

uniq命令选项及其意义

-c		#打印每行在文本中重复出现的次数
-d		#只显示有重复的记录,每个重复记录只出现一次
-u		#只显示没有重复的记录
  1. join命令
    join命令用于实现两个文件中记录的连接操作,连接操作是关系数据库中的概念,简言之,连接操作将两个文件中具有相同域的记录选择出来,再将这些记录所有的域放到一行(包含来自两个文件的所有域)。
    在这里插入图片描述
d:x:e		#包含3个域,以冒号分割域
  1. cut命令
    cut命令用于从标准输入或文本文件中按域或行提取文本,cut命令的基本格式为:cut [选项] 文件
-c		#指定提取的字符数或字符范围
-f		#指定提取的域数或域范围
-d		#改变域分隔符
  1. paste命令
    paste命令用于将文本文件或标准输出中的内容粘帖到新的文件,它可以将来自不同文件的数据粘帖到一起,形成新的文件。paste命令的基本格式是:paste [选项] 文件1 文件2
-d  #默认域分隔符是空格或Tab键,设置新的域分隔符
-s  #将每个文件粘帖成一行
-   #从标准输入中读取数据
  1. split命令
    split命令用于将大文件切割成小文件,split命令可以按照文件的行数、字符数切割文件,并能在输出的多个小文件中自动加上编号。split命令的基本格式:split [选项] 待切割的大文件 输出的小文件
-或-l  #此两个选项等价,都用于指定切割成小文件的行数
-b     #指定切割成小文件的字节
-C     #与-b选项类似,但是,切割时尽量维持每行的完整性

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/u012204535/article/details/83120124