Python 日志解析、状态码分析、网站流量分析、IP地址分析、地理信息分析

关注微信号:小程在线

关注CSDN博客:程志伟的博客

Python 日志解析、状态码分析、网站流量分析、IP地址分析、地理信息分析

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
#!pip install apache-log-parser
import apache_log_parser
%matplotlib inline

#------------------apache log日志--------------------
'''
本案例参考 Nikolay Koldunov([email protected])文章完成

我们使用apache-log-parser进行apalce log分析。log解析前我们需要了解对应的网站的Apahce log的配置。 这里我们已经知道待分析网站的log格式为:

format = r'%V %h  %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %T'

对应的各字段代表内容如下:(参考stackoverflow):

%V  - 根据 UseCanonicalName 设置的服务器名字
%h  - 远程主机(客户端 IP)
%l  - identity of the user determined by identd (not usually used since not reliable)
%u  - 由 HTTP authentication 决定的 user name
%t  - 服务器完成处理这个请求的时间
%r  - 来自客户端的请求行。 ("GET / HTTP/1.0")
%>s - 服务器端返回给客户端的状态码(200, 404 等等。)
%b  - 响应给客户端的响应报文大小 (in bytes)
\"%{Referer}

猜你喜欢

转载自blog.csdn.net/c1z2w3456789/article/details/104414512