对比《Spark机器学习第2版》PDF中英文代码+《白话机器学习算法》中英文PDF+数据来源

Spark是一个新的分布式计算框架,提供简洁明了的函数式API,完全兼容Hadoop生态系统。Spark自带一个支持分布式机器学习和包含若干数据挖掘模型的工具包Spark MLlib。该工具包正在重点开发中,但已包括多个针对常见机器学习任务的高质量、可扩展的算法。

《Spark机器学习第2版》结合案例研究讲解Spark 在机器学习中的应用,并介绍如何从各种公开渠道获取用于机器学习系统的数据。内容涵盖推荐系统、回归、聚类、降维等经典机器学习算法及其实际应用。新增了有关机器学习数学基础以及Spark ML Pipeline API 的章节,内容更加系统、全面、与时俱进。

《Spark机器学习第2版》中文PDF,394页,带目录,文字可复制;英文PDF,彩色配图,带目录,文字可复制。配套源代码。
下载: https://pan.baidu.com/s/13xNOave5kVDPqFvZHDNqJw
提取码: 7i43

Spark构建推荐引擎”展示了如何创建一个基于协同过滤的推荐模型。该模型将用于向给定用户推荐物品,以及创建与给定物品相似的物品清单。这一章还会讲到如何使用标准指标来评估推荐模型的效果。Spark构建分类模型阐述如何创建二元分类模型,以及如何利用标准的性能评估指标来评估分类效果。Spark构建回归模型”扩展了第6章中的分类模型以创建一个回归模型,并详细介绍了回归模型的评估指标。

学习机器学习时,建议阅读《白话机器学习算法》,大白话来解释各种算法,没有具体实现,不过引用的示例很易懂,各种算法解释的也到位。

《白话机器学习算法》中文PDF,115页,带目录,文字可复制;英文PDF,134页,带目录,文字可复制。配套数据集链接。

下载: https://pan.baidu.com/s/1VjbePHUMGRxJDiEAqRRJVw
提取码: 7wgx

与使用数学语言或计算机编程语言讲解算法的书不同,用通俗易懂的人类语言以及大量有趣的示例和插图讲解10多种前沿的机器学习算法。内容涵盖k均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法,以及回归分析、k最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法,并概述强化学习算法的思想。任何对机器学习和数据科学怀有好奇心的人都可以构建知识体系。每种算法都用最简单的例子解释了原理,尤其是svm的解释给我留下很深的印象,很适合作为入门材料。

学习机器学习时,我们一定要掌握scikit-learn的使用。推荐学习《scikit-learn机器学习常用算法原理及编程实战》,案例也采用的是中文数据,比较适用。《scikit-learn机器学习常用算法原理及编程实战》例子都比较通俗易懂,可以作为入门书,有实例代码和复习题,结合scikit和具体算例介绍机器学习的常用算法和scikit的使用,挺好的。

《scikit-learn机器学习常用算法原理及编程实战》原版PDF,224页,带书签目录,文字可以复制。配套源代码。

下载: https://pan.baidu.com/s/1kW_hOes7V9yubgGZg99aSg
提取码: 2kg5

《scikit-learn机器学习常用算法原理及编程实战》通过通俗易懂的语言、丰富的图示和生动的实例,拨开了笼罩在机器学习上方复杂的数学“乌云”,学习者可以较低的代价和门槛轻松入门机器学习。《scikit-learn机器学习常用算法原理及编程实战》分为11章,主要介绍了在Python环境下学习scikit-learn机器学习框架的相关知识。主要内容有机器学习概述、Python机器学习软件包、机器学习理论基础、k-近邻算法、线性回归算法、逻辑回归算法、决策树、支持向量机、朴素贝叶斯算法、PCA 算法和k-均值算法等。

 研究大数据和数据挖掘的都知道,并行化算法研究是大数据领域一个较为重要的研究热点。近年来国内外开始关注在 Spark 平台上如何实现各种机器学习和数据挖掘并行化算法设计。Spark 提供了大量的库,包括SQL、DataFrames、MLlib、GraphX、Spark Streaming。 开发者可以在同一个应用程序中无缝组合使用这些库。

 《深度实践Spark机器学习》PDF,247页,带书签目录,文字可以复制;

下载: https://pan.baidu.com/s/1erZxFaKoa2vKSun1tgQPFA
提取码: 73t6

系统讲解了Spark机器学习的技术、原理、组件、算法,以及构建Spark机器学习系统的方法、流程、标准和规范。此外,还介绍了Spark的深度学习框架TensorFlowOnSpark,以及如何借助它实现卷积神经网络和循环神经网络。

 《自己动手写神经网络》讲解通俗易懂,使用简单的语言描述人工神经网络的原理,并力求以具体实现与应用为导向,除了理论介绍外,每一章节的应用和实践都有具体的实例实现,达到学以致用。

《自己动手写神经网络》PDF,212页,带书签目录,文字可复制。配套源代码。

下载: https://pan.baidu.com/s/1w927HWOXAYuYqeQtcmSnJg
提取码: pgmu

自己动手写神经网络:简单的人工神经网络模型和理论应用;一个基于Java的人工神经网络框架Neuroph;基于Neuroph开发一个简单的人工神经网络系统—感知机;ADALINE网络以及使用Neuroph实现ADALINE神经网络;BP神经网络的基本原理和具体实现;BP神经网络的具体实践应用;Hopfield网络的原理、实践和应用;双向联想网络BAM的原理、实践和应用;竞争学习网络,特别是SOM网络以及相关算法与实现;PCA方法以及与PCA方法等价的PCA神经网络。

猜你喜欢

转载自www.cnblogs.com/duyuhui/p/11333583.html