R语言与数据分析(1) 数据分析流程、数据挖掘、数据可视化

R软件

  • R是免费的
  • R是一个全面的统计研究平台,提供了各式各样的数据分析技术
  • R拥有顶尖的绘图功能

数据分析

什么是数据

数据是对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合

为什么要做数据分析?

通过数据分析的结果来指导决策

数据分析的过程

数据采集→数据存储→数据分析→数据挖掘→数据可视化→进行决策

数据采集

采集的数据称为原数据,

以文件形式存储数据

数据统计

使用统计方法,有目的地对收集到的数据进行分析处理,并解读分析结果

数据挖掘

数据挖掘,英文名叫Data Mining,又称为资料勘探、数据采矿,一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程
数据据挖掘与数据统计的区别

  • 数据据挖掘不能确定挖掘出什么,用于探索未知,具体方法也不知道;而数据统计的目标一般都比较明确,知道要计算哪些值,比如求和,计算平均值等,只需要使用合适的统计方法即可
  • 数据挖掘通常与计算机科学有关,通过统计在线分析处理、情报检索、机器学习、人工智能、专家系统和模式识别等诸多方法来实现数据挖掘这个目标;
  • 数据统计,不同的统计人员使用不同的方法必须计算出同样的结果才行;而数据挖掘,同样的数据,不同的人可能会得到不同的结果
  • 数据挖掘与数据统计并不是相互独立的,数据挖掘过程中也需要用到统计学的知识

数据挖掘与三个重大的思维转变
1.要分析与某事物相关的所有数据,而不是依靠分析少量数据样本
2.我们乐于接受数据的纷繁复杂,而不再追求精确性
3.不再探求难以捉摸的因果关系,转而关注事物的相关关系

数据可视化

图形往往比数字更一目了然,如GPS定位得到的经纬度信息用地图展示更好

进行决策

猜你喜欢

转载自blog.csdn.net/qq_44520665/article/details/113479746