一条访问日志如下:
112.10.94.234 - - [22/Aug/2017:14:01:26 +0800] “POST /item/detail.mooc?a=1&b=2&c=5 HTTP/1.1” 200 2582 “http://www.chinamoccs.com/study/initplay/540.mooc” “Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebkit/603.3.8 (KHTML, like Gecko) Version/10.1.2 Safari/603.3.8”
从日志中获取的信息
- 用户的IP:城市,网络运营商
- 访问时间:提取具体的访问小时数
- 请求链接:提取有效的链接
- 来源链接:分类(自身,搜索引擎等)
- 客户端信息:提取用户操作系统,浏览器名称等等
网站的流量分析常见指标
- IP(独立IP):即独立IP数。00:00 - 24:00内相同IP地址被计算一次。
- PV(访问量):即Page View,即页面浏览量,用户每次刷新即被计算一次。
- UV(独立访客):即Unique Visitor,访问您网站的一个客户端为一个访客(一般在Cookie中分配唯一编号)。
注:Cookie在日志中一般是收集不到的,所以UV一般是通过IP + 用户客户端操作系统来进行确定的。
这三个指标单独出现往往没有什么意义,但是我们可以把它们关联起来进行分析:
-
PV 和 UV 数很接近的时候,我们就可能会认为用户访问我们网站的时候点击次数并不多,每个用户可能进来点了一两次就离开我们的网站了,网站的内容可能并不吸引用户。
-
IP 大于 UV 时,我们就可能会认为使用家庭宽带的用户比较多,因为家庭宽带的IP是不固定的,可能会发生变动。
-
UV 大于 IP 时,我们就可能会认为使用非家庭宽带(公司,团体机构)的用户比较多,因为很多公司的出口IP(外网IP)是固定的,所有的员工都使用这同一个出口IP访问网络。
网站的流量分析
访问趋势图:即一段时间中用户在各个时间段用户访问情况,也可以按PV,UV,IP指标细分。
从这张图中我们可以看出上午的9点到11点,下午的14点到18点是用户访问的小高峰,通过这样的一个线图我们就可以大致了解我们服务器的一个负载情况。在知道了我们服务器再一天中的负载情况之后,我们就可以来调整我们网站中的一些程序。
分析: 我们经常会有一些统计的任务需要去定时执行,我们就可以在用户访问次数比较低的时间段去执行我们的定时任务,来减轻服务器高峰期的压力。
网站的来源分析
访问来源分析:即用户从各个来源网站进入本站的占比。
搜索引擎来源:即来源中的各个搜索引擎的占比。
分析:
-
从访问来源占比中可以看出:从搜索引擎进入本站的占比并不高,说明用户在输入了某些与本站有关的内容后,大部分信息并不能直接在搜索引擎上显示出来(或者排名比较靠后,在后面几页才能搜到),说明网站的SEO做的不到位,还需要进一步提高SEO。
-
从搜索引擎占比可以看出:使用百度的用户比较多,我们就可以在具体的搜索引擎上打些广告。(例如:本站)。
网站的访问分析
访问链接TopN:即用户访问最多的链接。
恶意攻击IP:搜集疑似恶意攻击本网站的IP,用于IP黑名单。
分析:
-
通过访问链接TopN,我们就可以知道用户最经常访问我们网站的什么链接,知道了这些之后如果我们想增加我们网站商品的销量,就可以在这些页面上打打广告,放上一些对应商品的链接,或者一些优惠的链接。
-
我们的网站可以被任意用户访问,很多的恶意攻击往往是来自一些具有竞争关系的同行,它们使用恶意攻击的方式使我们的网站变的不稳定,降低我们正常用户的体验。我们就可以把这样的恶意访问的IP列入黑名单。我们判定是否是恶意访问IP的依据是:大量的404请求。
网站的访客分析
访客地域分布:即访客所处的地理位置。
访客浏览器:即访客采用什么样的浏览访问网站,如Chrome,Firefox等。
分析:
-
从访客的地域分布我们可以看出华东地区的访问用户比较多,我们总不能老让用户去访问我们在新疆购买的服务器吧?那么我们就可以把服务器部署到离我们大量用户较近的地域,提升用户的访问体验。
-
从访客的浏览器中我们可以看出使用Firefox,Chrome访问我们网站的用户比较多,我们就可以针对性的对我们的网站进行优化,查看我们页面的样式在这些浏览器上加载是否正常,有没有位置错乱的情况。如果有样式错乱的情况,需要针对性的进行修复,以提升用户的体验。
访客操作系统:即访客所使用的操作系统,如windows,OS X,安卓,IOS等。
访客网络运营商:即访客所使用的网络运营商,如电信,联通,移动等等。
分析:
-
从访客操作系统分布我们可以看出使用Windows,OS X访问我们网站的用户比较多,而通过安卓,IOS访问的用户比较少,我们就可以猜测大多数用户通过PC端访问我们的网站,我们就可以针对PC端的网页进行一些优化,多增加一些内容,而较少的考虑在响应式的情况下手机端布局的变化。
-
从访客网络运营商分布我们可以看出:使用电信,联通的访问人数比较多。我们就可以增加一些电信服务器的配额。但是,如果使用阿里云的服务器就不需要考虑这些情况,它在内部自动做了多网合一。
网站的优化
针对上面分析的一些结论我们就可以对我们网站进行一些优化:
- 网站程序优化:考虑页面再不同浏览器上的显示情况。
- 网站服务器优化:将程序部署在离大量用户较近的服务器上。
- 搜索引擎推广:针对用户经常使用的搜索引擎做一些推广。