《Spark 3.0大数据分析与挖掘：基于机器学习》简介

#好书推荐##好书奇遇季#《Spark 3.0大数据分析与挖掘：基于机器学习》，京东当当天猫都有发售。Spark作为新兴的、应用范围广泛的大数据处理开源框架，吸引了大量的大数据分析与挖掘从业人员进行相关内容的学习与开发，其中ML是Spark 3.0机器学习框架使用的核心。本书用于Spark 3.0 ML大数据分析与挖掘入门，本书配套示例源码、PPT课件、数据集与答疑服务。

本书内容

本书共分13章，从Spark 3.0大数据分析概述、基础安装和配置开始，依次介绍ML的DataFrame、ML的基本概念，以及协同过滤、线性回归、分类、决策树与随机森林、聚类、关联规则、数据降维、特征提取和转换等数据处理方法；最后通过经典的鸢尾花分析实例，回顾前面的学习内容，实现了一个完整的数据分析与挖掘过程。

本书特点

（1）本书尽量避免纯粹的理论知识介绍和高深技术研讨，完全从应用实践出发，用最简单、典型的示例引申出核心知识，最后指出通往“高精尖”进一步深入学习的道路。

（2）本书全面介绍ML涉及的数据挖掘的基本结构和上层程序设计，借此能够系统地看到ML的全貌，使读者在学习过程中不至于迷失方向。

（3）本书在写作上浅显易懂，没有深奥的数学知识，采用较为简洁的形式描述应用的理论知识，让读者轻松愉悦地掌握相关内容。

（4）本书旨在引导读者进行更多技术上的创新，每章都会用示例描述的形式帮助读者更好地学习内容。

（5）本书代码遵循重构原理，避免代码污染，引导读者写出优秀、简洁、可维护的代码。

（6）本书所有数据格式均为DataFrame类型，并且使用管道技术执行机器学习算法。

本书读者

本书适合Spark 3.0机器学习初学者、大数据分析和挖掘人员，也适合高等院校和培训机构人工智能与大数据相关专业的师生教学参考。

本书作者

王晓华，计算机专业讲师，研究方向为云计算、大数据与人工智能。著有图书《Spark 3.0大数据分析与挖掘：基于机器学习》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow知识图谱实战》《TensorFlow人脸识别实战》《TensorFlow语音识别实战》《TensorFlow 2.0卷积神经网络实战》《Keras实战：基于TensorFlow2.2的深度学习实践》《TensorFlow深度学习从零开始学》《深度学习的数学原理与实现》。

《Spark 3.0大数据分析与挖掘：基于机器学习》简介

猜你喜欢