Linux还提供了一些命令行工具来处理大型的数据
sort命令可以对数据进行排序(默认按照回话指定的默认语言的排序规则对文本文件中的数据行进行排序)(默认是升序)
且默认情况下,sort命令会把数字当做字符执行标准的字符排序,所以对数字进行排序时,需要使用-n参数
-M参数,按月排序,Linux的日志文件经常会在每行的起始位置有一个时间戳(三字符月份),用来表明事件是什么时候发生的
还有很多的选项参数,在实际问题中可继续学习!
对password文件中的各行排序,-t 指定字段分隔符,-k 指定排序的字段,对用冒号分隔的第三个字段(数字ID)进行排序
结合之前的du命令
-r参数将结果降序输出,这样就可以看出那个文件占用空间最多
(管道命令 | 将du命令的输出重定向到sort命令,比较有用,后面会详细讨论)
想要在Linux中搜索一些数据时,可以使用grep命令。
grep [options] pattern [file]
grep命令会在输入或指定的文件中查找包含匹配指定模式的字符的行,grep的输出就是包含了匹配模式的行。
grep t file1
查找file1文件中包含字母t的所有行
grep命令非常流行,后期经历很多更新,加入了大量的新功能(记得多用man和help命令查看手册)
grep -v t file1
输出不包含t字母的行
grep -n t file1
输出时显示行号
grep -c t file1
输出满足匹配的总行数
grep -e t -e f file1
-e选项参数用来指定多个模式,满足或的关系
grep [tf] file1
方括号表示正则表达式,搜索包含t或f的匹配
egrep命令是grep的一个衍生,支持POSIX扩展正则表达式
fgrep命令是另外一个版本,支持匹配模式指定为用换行符分隔变为一列固定长度的字符串,fgrep可搜索大型文件中的字符串。
Linux中包含了大量的文件压缩工具
bzip2 .bz2 采用BW块排序文本压缩算法和霍夫曼编码
compress .Z 采用Unix文件压缩工具,已经快没人用了
gzip .gz GNU的压缩工具,LZ编码
zip .zip Windows上PKZIP工具的UNix实现
gzip是比较实用的压缩工具
gzip myfile
压缩文件
gzcat 用来查看压缩过的文本文件的内容
gunzip 用来解压文件
目前,Unix和Linux上,最流行的归档工具是tar命令(归档数据:归档就是分类的意思,在linux中就是把一些文件放在一个包中归类)
tar function [options] obj1 obj2
tar -cvf test.tar test/ test1/
创建名为test.tar的归档文件,含有test和test1目录
tar -tf test.tar
列出tar文件中的内容(但并不提取文件)
tar -xvf test.tar
提取tar文件中的内容(文件名以.tgz结尾,gzip压缩的文件,可以用tar -zxvf解压缩)