网站点击流数据分析

网站点击流数据分析：

1. WEB访问日志，即指用户访问网站时的所有访问、浏览、点击行为数据。比如点击了哪一个链接，在哪个网页停留时间最多，采用了哪个搜索项、总体浏览时间等。而所有这些信息都可被保存在网站日志中。通过分析这些数据，可以获知许多对网站运营至关重要的信息。采集的数据越全面，分析就能越精准；

2. 日志的生成渠道：
   1）是网站的web服务器所记录的web访问日志；
   2）是通过在页面嵌入自定义的js代码来获取用户的所有访问行为（比如鼠标悬停的位置，点击的页面组件等），然后通过ajax请求到后台记录日志；这种方式所能采集的信息最全面；
   3）通过在页面上埋点1像素的图片，将相关页面访问信息请求到后台记录日志；

3. 日志数据内容详述：
   在实际操作中，有以下几个方面的数据可以被采集：
   1)访客的系统属性特征。比如所采用的操作系统、浏览器、域名和访问速度等。
   2)访问特征。包括停留时间、点击的URL等。
   3)来源特征。包括网络内容信息类型、内容分类和来访URL等。
   4)产品特征。包括所访问的产品编号、产品类别、产品颜色、产品价格、产品利润、产品数量和特价等级等。

4. 点击流：点击流这个概念更注重用户浏览网站的整个流程，网站日志中记录的用户点击就像是图上的“点”，而点击流更像是将这些“点”串起来形成的“线”。也可以把“点”认为是网站的Page，而“线”则是访问网站的Session。所以点击流数据是由网站日志中整理得到的，它可以比网站日志包含更多的信息，从而使基于点击流数据统计得到的结果更加丰富和高效；

5. 数据仓库标准上可以分为四层：ODS（临时存储层Operational Data Store）、PDW（数据仓库层Data Warehouse）、DM（数据集市层）、APP（应用层）；

6. 星型模型因为数据的冗余所以很多统计查询不需要做外部的连接，因此一般情况下效率比雪花型模型要高。星型结构不用考虑很多正规化的因素，设计与实现都比较简单。雪花型模型由于去除了冗余，有些统计就需要通过表的联接才能产生，所以效率不一定有星型模型高。正规化也是一种比较复杂的过程，相应的数据库结构设计、数据的 ETL、以及后期的维护都要复杂一些。因此在冗余可以接受的前提下，实际运用中星型模型使用更多，也更有效率；

网站点击流数据分析

猜你喜欢