- 数据挖掘和数据分析之间的区别是什么?
数据分析:针对个别属性的实例分析。提供有关淑红的各种信息,如值范围,离散值以及频率,空值的发生,数据类型,长度等;
数据挖掘:重点关注聚类分析,异常记录检测,依赖关系,序列发现,多个属性之间的关系控制等。 - 解释异常值是什么?
异常值是分析师使用的一个术语,指的是一个圆圆超出样本总体模式的值。 - 解释分层聚类算法是什么?
分层聚类算法结合并划分现有的组,创建分层结构并展示组换分或合并的顺序。 - 解释K均值算法是什么?
K-均值是一种著名的分区方法。对象被分类为属于K个组中的一个,K是先验选择的。在K均值算法中:
簇是球形的:簇中的数据点以该簇为中心;
簇的方差/扩展示相似的:每个数据点属于最接近的簇。 - 数据分析师所需要掌握的关键技能是什么?
数据库知识(查询,操作)
预测分析(基本描述性统计,预测建模,高级分析)
大数据知识(大数据分析,非结构化数据分析,机器学习)
演示技巧(数据可视化,报告设计) - 协同过滤是什么?
协同过滤是一种基于用户行为数据创建推荐系统的简单算法。协同过滤最重要的组件是用户对项目的兴趣。
协同过滤一个很好的例子就是购物网站上出现的类似“为您推荐”的模块,该模块通常会获取用户的浏览记录信息,以弹出用户可能喜欢或需要的商品。 - 解释什么是KPI。实验设计和80/20规则?
关键绩效指标(KPI):它代表关键绩效指标,它是关于业务流程的报告或图表
实验设计:这是用于分解数据,采样和建立数据以进行统计分析的初始过程
80/20规则:这意味着你收入的80%来自客户的20% - 时间序列分析是什么?
时间序列分析可以再频域和时域两个域中完成。在时间序列分析中,可以通过指数平滑对数线性回归等各种方法分析数据,来预测特定过程的输出。 - 解释空间自相关分析是什么?
空间自相关分析师地理空间分析的常见形式。它由一系列为不同空间关系计算的估计自相关数组成。当原始数据表示为距离我不是单个点的值时,它可以用于构建基于距离的数据关系图。 - List item
数据分析可能会遇到的面试题
猜你喜欢
转载自blog.csdn.net/Alien_lily/article/details/82984071
今日推荐
周排行