网站点击流数据分析

网站点击流数据分析:

1. WEB访问日志,即指用户访问网站时的所有访问、浏览、点击行为数据。比如点击了哪一个链接,在哪个网页停留时间最多,采用了哪个搜索项、总体浏览时间等。而所有这些信息都可被保存在网站日志中。通过分析这些数据,可以获知许多对网站运营至关重要的信息。采集的数据越全面,分析就能越精准;

2. 日志的生成渠道:
    1)是网站的web服务器所记录的web访问日志;
    2)是通过在页面嵌入自定义的js代码来获取用户的所有访问行为(比如鼠标悬停的位置,点击的页面组件等),然后通过ajax请求到后台记录日志;这种方式所能采集的信息最全面;
    3)通过在页面上埋点1像素的图片,将相关页面访问信息请求到后台记录日志;

3. 日志数据内容详述:
    在实际操作中,有以下几个方面的数据可以被采集:
    1)访客的系统属性特征。比如所采用的操作系统、浏览器、域名和访问速度等。
    2)访问特征。包括停留时间、点击的URL等。
    3)来源特征。包括网络内容信息类型、内容分类和来访URL等。
    4)产品特征。包括所访问的产品编号、产品类别、产品颜色、产品价格、产品利润、产品数量和特价等级等。

4. 点击流:点击流这个概念更注重用户浏览网站的整个流程,网站日志中记录的用户点击就像是图上的“点”,而点击流更像是将这些“点”串起来形成的“线”。也可以把“点”认为是网站的Page,而“线”则是访问网站的Session。所以点击流数据是由网站日志中整理得到的,它可以比网站日志包含更多的信息,从而使基于点击流数据统计得到的结果更加丰富和高效;

5. 数据仓库标准上可以分为四层:ODS(临时存储层Operational Data Store)、PDW(数据仓库层Data Warehouse)、DM(数据集市层)、APP(应用层);

6. 星型模型因为数据的冗余所以很多统计查询不需要做外部的连接,因此一般情况下效率比雪花型模型要高。星型结构不用考虑很多正规化的因素,设计与实现都比较简单。雪花型模型由于去除了冗余,有些统计就需要通过表的联接才能产生,所以效率不一定有星型模型高。正规化也是一种比较复杂的过程,相应的数据库结构设计、数据的 ETL、以及后期的维护都要复杂一些。因此在冗余可以接受的前提下,实际运用中星型模型使用更多,也更有效率;

猜你喜欢

转载自blog.csdn.net/qq_43285577/article/details/83791684