数据挖掘初探

数据挖掘技术分类http://www.vsharing.com/k/BI/2011-10/A651190.html

1 关联分析:啤酒和尿布,猜你喜欢

用于做关联分析的算法有Apriori

2 分类分析:事先知道类别和分类标准,用户信用分层

3 序列模式:访问路径、购买路径

4 聚类分析:分类分析的逆过程,聚类分析之前还不知道类别,从大量数据集合中,自动划分类别。划分标准是类内差别最小,类间差别最大

http://ebike.blog.bokee.net/bloggermodule/blog_viewblog.do?id=6094445

http://www.lw23.com/pdf_3780b81c-9173-41e9-983b-61f161a1454d/lunwen.pdf

通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。

http://202.119.108.115/nsxr/Text%2F2009-09-07-01-54-28by2bawehfvvjhw55kaco22vb_%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E6%8A%80%E6%9C%AF%E5%8F%8A%E5%85%B6%E5%BA%94%E7%94%A8.pdf

扫描二维码关注公众号,回复: 696536 查看本文章

主要算法有神经元网络算法、决策树算法、遗传算法

http://idmer.blog.sohu.com/120174910.html

http://www.5ykj.com/Article/xslwjjgl/51454.htm

在零售业,数据挖掘可有助于识别顾客购买行为,发现顾客购买模式和趋势,改进服务质量,取得更好的顾客保持力和满意程度,提高货品销量比率,设计更好的货品运输与分销策略,减少商业成本。

5 关键概念

支持度(Support)的公式是:Support(A->B)=P(A U B)。支持度揭示了A与B同时出现的概率。如果A与B同时出现的概率小,说明A与B的关系不大;如果A与B同时出现的非常频繁,则说明A与B总是相关的。
置信度(Confidence)的公式式:Confidence(A->B)=P(A | B)。置信度揭示了A出现时,B是否也会出现或有多大概率出现。如果置信度度为100%,则A和B可以捆绑销售了。如果置信度太低,则说明A的出现与B是否出现关系不大。
    示例:某销售手机的商场中,70%的手机销售中包含充电器的销售,而在所有交易中56%的销售同时包含手机和充电器。则在此例中,支持度为56%,置信度为70%。

引用http://blog.sina.com.cn/s/blog_50b290120100dwet.html

猜你喜欢

转载自hill007299.iteye.com/blog/1434665
今日推荐