Beginning Data Exploration and Analysis with Apache Spark 使用Apache Spark开始数据探索和分析 中文字幕

使用Apache Spark开始数据探索和分析 中文字幕

Beginning Data Exploration and Analysis with Apache Spark
Alt
无论您是想要探索数据还是开发复杂的机器学习模型,数据准备都是任何数据专业人士的主要任务
Spark是一种引擎,它以非常直观的方式帮助实现这一目标,使用功能结构将用户从使用大型数据集的所有混乱中抽象出来
在本课程中,使用Apache Spark开始数据探索和分析,您将逐步完成探索性数据分析和Spark数据整理
首先,您将探索RDD和功能构造,使Spark中的处理非常直观
接下来,您将了解如何转换和清理非结构化数据
最后,您将学习如何沿着维度汇总数据以及如何建立关系以建立共现网络
在本课程结束时,您将能够使用Spark以您想要的任何方式转换数据

Alt
Alt
Alt
Alt
Alt
嗨,大家好。
我的名字是Swetha Kolalapudi,欢迎来到我的课程,使用Apache Spark开始数据探索和分析。
我是一家名为Loonycorn的创业公司的联合创始人。
清理,转换和准备数据是任何数据专业人员的主要任务,无论他们只是想探索数据并使用它,还是开发复杂的机器学习模型。
Spark是一种引擎,可以帮助我们以非常直观的方式执行此操作,使用功能构造将用户从使用大型数据集的所有混乱中抽象出来。
本课程的主要内容是使用Spark和弹性分布式数据集来处理复杂的数据。
当你完成时,你会习惯使用像filter,map和reduce这样的函数结构来转换数据,并使用RDD和Pair RDD来汇总和合并数据集。
我们将讨论的一些主要议题包括转换和清理非结构化数据,沿维度汇总数据以及建立关系以建立共现网络。
在本课程结束时,您将能够使用Spark以您喜欢的任何方式转换数据。
在开始本课程之前,您应该熟悉基础级别的Python。
我希望你能和我一起在Pluralsight上用Apache Spark学习开始数据探索和分析。
本课程视频下载地址:使用Apache Spark开始数据探索和分析

猜你喜欢

转载自blog.csdn.net/lyndacn/article/details/83057315