大数据基础--大数据商业应用(刘鹏《大数据》课后习题答案)

1.简述对用户画像的认识。

   用户画像,即用户信息的标签化,是企业通过收集、分析用户数据后,抽象出的一个虚拟用户,可以认为是真实用户的虚拟代表。

2.简述构建用户画像的主要流程。

   基础数据收集->行为建模->构建画像

                                           

3.个性化推荐系统的性能可以通过哪些标准来判定?

   用户满意度  覆盖率  预测准确度  冷启动问题  过度推荐热门问题  个性化推荐

4.简述对广告点击率计算公式的理解。

   指广告展示中被用户点击打开的次数在总展示次数中的比率.

                               

5.影响广告点击率的因素有哪些?

   (1)广告自身的影响 ,广告的类型和广告内容对点击量影响十分显著

  (2)上下文环境影响,网络广告出现的位置极其重要.

  (3)广告浏览者的影响,不同的人群有不同的喜好,这会导致对广告的"偏爱"不同

6.广告点击预估的方法有哪些?

   (1)直接估计法

                   

  (2)点击率预估模型计算方法

                                             

7.分别简述基于位置的广告推荐的两种形式。

   (1)“主动式”,也称“推”式,指广告服务提供商根据用户所在位置,主动向客户发送广告,直至用户取消广告订阅或将广告屏蔽为止。

  (2)“被动式”,也称“拉”式,指用户通过关键词发起搜索,推荐系统根据搜索关键词、用户当前位置信息和用户其他特征返回出推荐结果。

8.简述互联网金融的概念。

   互联网金融是指以依托于支付、云计算、社交网络以及搜索引擎等互联网工具,实现资金融通、支付和信息中介等服务的一种新型金融。互联网金融是在实现安全、移动等网络技术水平上,被用户熟悉接受后自然而然为适应新的需求而产生的新模式及新业务。

9.简述大数据在互联网金融中的应用方向。

   (1)金融反欺诈与分析

  (2)构建更全面的信用评价体系

  (3)高频交易和算法交易

  (4)产品和服务的舆情分析

                 

10.简述机器学习在大数据金融中的应用。

   (1)信用评分算法

  (2)分类模型的性能评估

11.简述机器学习在大数据金融中的作用。

                            

12.简述主流的信用评估算法有哪些?

   (1)逻辑回归(Logistic Regression)算法

  (2)支持向量机(SVM)

  (3)决策树(Decision Tree)

  (3)随机森林(Random forest)

  (4)自适应提升(AdaBoost)

  (5)梯度提升决策树(GBDT)

13.简述分类模型的评价体系。 

   (1)混淆矩阵(Confusion Matrix) -> 提升图(Lift),增益图(Gain),受试者工作特征曲线(ROC)。

  (2)受试者工作特征曲线(ROC) -> 曲线下面积(AUC),洛伦兹曲线(KS) -> 基尼系数(GINI)。

  (3)标准误差(MSE)独立出来

猜你喜欢

转载自www.cnblogs.com/lsm-boke/p/11964418.html