1、查询文件中某一列,包含某个字符串的个数 cat data.txt | awk -F ',' '{print $8}' | grep '路由器' | wc -l 2、查询文件中某一列去重后的数据个数 cat data.txt | awk -F ',' '{print $1}' | sort | uniq | wc -l 3、查询文件有多少行 wc -l data.txt 4、将两个文件的并集输出到另一个文件 cat 1.txt 2.txt | sort |uniq > 5.txt 5、将两个文件的交集(某行相同的值)输出到另一个文件 cat 1.txt 2.txt | sort |uniq -d > 6.txt 6、去掉两个文件中的交集部分,剩下的部分输出到另一个文件 cat 1.txt 2.txt | sort | uniq -u > 7.txt 7、按行合并文件 cat 1.txt 2.txt > 8.txt 8、按列合并文件 文件中间用tab键分开 paste 1.txt 2.txt > 9.txt 文件中间用逗号分开 paste 1.txt 2.txt -d ',' > 10.txt 9、重复行 重复行保留一行输出 sort file | uniq 重复行全部去掉 sort file | uniq -u 10、批量替换文件中某个字符 将3.txt文件中的tab键换为逗号 sed -i 's/\t/,/g' 3.txt 将3.txt文件中的空格换为逗号 sed -i 's/ /,/g' 3.txt 将3.txt文件中的tab键换为逗号 perl -pi -e"s/\t/,/g" 3.txt
Linux下做数据分析常用操作
猜你喜欢
转载自blog.csdn.net/sxf_123456/article/details/80349292
今日推荐
周排行