Linux命令查找出日志文件中访问量最大的10个ip - 代码天地

Linux命令查找出日志文件中访问量最大的10个ip

其他 2018-12-07 19:17:18 阅读次数: 0

版权声明：转载请加链接 https://blog.csdn.net/qq_33722172/article/details/84257910

写这篇博客的主要原因就是之前面试的两家公司都有问到这个问题，所以便着手研究了一下它的解决方法
问题描述:一个日志文件里逐行存储着时间 ip 这种形式的日志，现在需要让你使用linux命令查找出日志文件中访问量最大的10个ip
怎么处理?
1.首先创建模拟数据
这里博主用python写了个创建模拟数据的脚本文件内容格式 : 时间戳 ip

#!/usr/bin/python
# -*- coding:UTF-8 -*-
#filename = testdata.py
import random
import time
file = open('/ip.txt','w');
for i in range(0,500):
   num = random.randint(1,10)
   rand_str = time.time()
   fir_1 = random.randint(0,255)
   sec_2 = random.randint(0,255)
   thr_3 = random.randint(0,255)
   fou_4 = random.randint(0,255)
   for j in range(1,num+1):   
      file.write(str(rand_str)+' '+str(fir_1)+'.'+str(sec_2)+'.'+str(thr_3)+'.'+str(fou_4)+'\n')
file.close() 
print 'create sucessful!!'

2.输入命令

cat ip.txt|awk -F" " '{print $2}'|sort|uniq -c|sort -nrt " "|awk -F" " '{print $2}'|head -10

每一步命令解释:
cat ip.txt 将ip.txt文件内容输出到终端
| 通过管道符|将左边命令输出作为右边命令输入（后面|功能类似）
awk -F" " ‘{print $2}’
-F 指定输入文件折分隔符 -F" ": 以空格分隔
{print $2} 分隔后每一行就分成了时间戳和ip两个单元$1指时间$2指ip print $2 即输出ip
sort 对输出ip进行排序
uniq -c 检查及删除文本文件中重复出现的行列 -c或–count 在每列旁边显示该行重复出现的次数。
此时输出的数据格式为出现次数 ip
sort -nrt " " 对输出结果排序 -n ：依照数值的大小排序 -r : 以相反的顺序来排序 -t : <分隔字符> 指定排序时所用的栏位分隔字符
接着继续用awk 将数据第二列ip输出
head -10 取前十条数据
命令执行结果:
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_33722172/article/details/84257910

Linux命令查找出日志文件中访问量最大的10个ip

使用Linux命令找出日志文件中访问量最大的top10 IP地址

apache日志中得到访问量最高前100个IP

从nginx日志中得到访问量最高前5个IP

linux 统计ip 当日的访问量

统计log中的ip访问量

nginx日志，怎么统计每个ip的访问量

shell - 计数, 日志查询访问量高的IP, iptable查访问包数, 按时间实施iptables命令

Wordpress用文件记录访客 IP和访问量

linux下使用shell查看apache IP访问量

查看web日志里访问量最多的5个

ubuntu从apache日志文件查找出ip

linux系统安全管理员必备 nginx日志统计客户端ip的访问量

查找Linux系统中的占用磁盘空间最大的前10个文件或文件夹

使用Python 统计nginx日志前十ip访问量并以柱状图显示

喜庆访问量达到10万

Linux——查找占用磁盘体积最大的前10个文件

Linux shell 脚本增加访问量

通过nginx日志统计一段时间内ip的访问次数进行排序&访问量统计

nginx统计访问量最高的ip并封禁IP

ETL：ROW_NUMBER() over(partition by 字段 order by 字段 desc)找出每个城市访问量最多的2个url

linux 在文件中查找ip的命令行

网站访问量统计之 UV/PV/IP 浅析

(转)shell查看apache IP访问量

shell习题--统计每个IP的访问量

shell-002：统计IP访问量

shell习题第2题：统计ip访问量

访问量统计

Python爬虫学习--WIN10下定时获取CSDN个人的访问量并保存到文件中2018/04/30

linux中用find命令找到最大的10个文件

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)