linux去除文件空行

方法一:利用grep

grep -v '^\s*$' test.txt > new_file

注:-v表示将匹配的结果进行反转,正则表达式匹配空行。(空行可包括空格符、制表符等空白字符)

方法二:利用sed

sed '/^\s*$/d' test.txt > new_file

注:d代表删除该行

或者:sed -i '/^\s*$/d' test.txt

方法三:利用awk

awk NF test.txt > new_file

注:NF代表当前行的字段数,空行的话字段数为0,被awk解释为假,因此不进行输出。

以上三种方式均可处理包含空白字符(空格符、制表符等)的空行。

方法四:若空行均由'\n'造成,则还可以利用tr命令去除空行

tr -s '\n' < test.txt > new_file

注:-s代表将多个连续的字符压缩成一个字符,这里是将多个'\n'压缩成一个'\n',达到去除空行的效果。方法四的缺陷:如果首行就出现空行的话则无法去除首行的空行。

相关拓展:

查看重复的行 sort -n test.txt | uniq -d

一、两个文件的交集,并集
1、取出两个文件的并集(重复的行只保留一份)
cat file1 file2 | sort | uniq > file3
2、取出两个文件的交集(只留下同时存在于两个文件中的文件)
cat file1 file2 | sort | uniq -d > file3
3、删除交集,留下其他的行
cat file1 file2 | sort | uniq -u > file3
二、两个文件合并
一个文件在上,一个文件在下
cat file1 file2 > file3
一个文件在左,一个文件在右
paste file1 file2 > file3
三、一个文件去掉重复的行
sort file | uniq
注意:重复的多行记为一行,也就是说这些重复的行还在,只是全部省略为一行!
sort file | uniq –u
上面的命令可以把重复的行全部去掉,也就是文件中的非重复行!

发布了19 篇原创文章 · 获赞 7 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/sosemseo/article/details/104044570