awk命令统计pv和uv

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xiaobao5214/article/details/88423680

查看ip.txt文件中的内容

[root@hadoop4 test]# cat ip.txt 
www.baidu.com	192.168.2.1
www.taobao.com	192.168.2.2
www.sina.com	192.168.2.3
www.taobao.com	192.168.2.1
www.taobao.com	192.168.2.3
www.baidu.com	192.168.2.1

统计所有网址的访问量,降序

[root@hadoop4 test]# awk  '{print $1}' ip.txt | sort | uniq -c | sort -n -r -k 1
      3 www.taobao.com
      2 www.baidu.com
      1 www.sina.com

统计访问所有网址的独立用户数

[root@hadoop4 test]# awk  '{print $2}' ip.txt | sort | uniq | wc -l
3

统计用户ip的访问所有网址的次数,降序

[root@hadoop4 test]# awk  '{print $2}' ip.txt | sort | uniq -c | sort -n -r -k 1 
      3 192.168.2.1
      2 192.168.2.3
      1 192.168.2.2

备注1:sort -k 1  -n -r  表示按第一列 数值大小 降序

备注2:uniq 命令之前要先 sort 完才能正确去重,否则无法正确去重

猜你喜欢

转载自blog.csdn.net/xiaobao5214/article/details/88423680