数据分析可能会遇到的面试题

  1. 数据挖掘和数据分析之间的区别是什么?
    数据分析:针对个别属性的实例分析。提供有关淑红的各种信息,如值范围,离散值以及频率,空值的发生,数据类型,长度等;
    数据挖掘:重点关注聚类分析,异常记录检测,依赖关系,序列发现,多个属性之间的关系控制等。
  2. 解释异常值是什么?
    异常值是分析师使用的一个术语,指的是一个圆圆超出样本总体模式的值。
  3. 解释分层聚类算法是什么?
    分层聚类算法结合并划分现有的组,创建分层结构并展示组换分或合并的顺序。
  4. 解释K均值算法是什么?
    K-均值是一种著名的分区方法。对象被分类为属于K个组中的一个,K是先验选择的。在K均值算法中:
    簇是球形的:簇中的数据点以该簇为中心;
    簇的方差/扩展示相似的:每个数据点属于最接近的簇。
  5. 数据分析师所需要掌握的关键技能是什么?
    数据库知识(查询,操作)
    预测分析(基本描述性统计,预测建模,高级分析)
    大数据知识(大数据分析,非结构化数据分析,机器学习)
    演示技巧(数据可视化,报告设计)
  6. 协同过滤是什么?
    协同过滤是一种基于用户行为数据创建推荐系统的简单算法。协同过滤最重要的组件是用户对项目的兴趣。
    协同过滤一个很好的例子就是购物网站上出现的类似“为您推荐”的模块,该模块通常会获取用户的浏览记录信息,以弹出用户可能喜欢或需要的商品。
  7. 解释什么是KPI。实验设计和80/20规则?
    关键绩效指标(KPI):它代表关键绩效指标,它是关于业务流程的报告或图表
    实验设计:这是用于分解数据,采样和建立数据以进行统计分析的初始过程
    80/20规则:这意味着你收入的80%来自客户的20%
  8. 时间序列分析是什么?
    时间序列分析可以再频域和时域两个域中完成。在时间序列分析中,可以通过指数平滑对数线性回归等各种方法分析数据,来预测特定过程的输出。
  9. 解释空间自相关分析是什么?
    空间自相关分析师地理空间分析的常见形式。它由一系列为不同空间关系计算的估计自相关数组成。当原始数据表示为距离我不是单个点的值时,它可以用于构建基于距离的数据关系图。
  10. List item

猜你喜欢

转载自blog.csdn.net/Alien_lily/article/details/82984071