关于本书

《现实生活中的机器学习》(Real-World Machine Leaning)是一本为想要将机器学习技术(Machine Leaning, ML)应用于现实生活中的人们而写的一本书。该书描述了ML领域主流的算法与工具。该书的关键在于实操，而非从头开始搭建模型。搭建和使用ML的每一个流程，书中都用由简到繁的例子进行说明。

学习路径

本书的第一部分“机器学习的工作流程”主要由5部分构成：

第一章 “什么是机器学习”主要介绍什么是机器学习，并阐述机器学习的用途；
第二章 “现实生活中的数据” 深入研究机器学习流程中数据的准备与处理过程；
第三章 “建模与预测”阐述如何构建简单的机器学习模型，并使用经典的算法和模型库进行预测；
第四章 “模型验证与优化”，本章主要是深入研究建立的机器学习模型，并对其进行验证与优化；
第五章 “基本特征工程”，本章介绍了一些常用的特征工程方法。

第二部分，主要介绍了一些用于模型建立和特征提取的技术。这部分共有5章，主要包含三个完整的例子：

第六章 “例子”NYC出租车数据”，本章中你讲对出租车乘客的支付小费行为进行预测。
第七章 “高级特征工程”，本章中主要介绍了从自然语言文本、图像、以及时间序列数据中提取特征的技术与方法。
第八章 “NLP例子：影评”，本章中利用特征工程的方法对在线影评进行预测。
第九章 “调整机器学习工作流”，本章中提出了将ML系统更适应更大的数据量、更高的预测吞吐量和更低的预测延迟的技术。
第十章 “例如：数字显示广告“，本章中根据大量数据建立机器学习模型，对在线数字显示广告点击行为进行预测。

如何使用本书

如果你是一个初学者，那么本书的第一到第五章会引导您通过数据准备和探索、特征工程、建模和模型评估的过程。书中的python程序使用了主流的机器学习库(pandas和sklearn).第6章到第10章中包括三个完整的机器学习例子，以及特征工程方法和模型优化方法。因为所使用的库都进行了很好的封装，所以，书中的代码可以很好的移植到你的ML应用中。

目标读者

本书可供程序员、数据分析师、统计学家、数据科学家以及希望将机器学习技术应用于实际问题或者仅仅希望了解机器学习技术的人们进行阅读。阅读本书的人可以在没有深刻理论推导的前提下对现实生活中的数据进行处理、建模、优化及部署。并且为那些准备深入理解ML的人们进行了数学讨论。总之，本书的重点是利用ML解决实际问题。

配套代码下载及环境需求

源代码使用Python、pandas和sklearn，每章中的IPython notebook 都可以从Github中获取。每章中的(.ipynb)文件所关联的数据都在对应的目录中。需安装ipython（新手建议直接安装anaconda）。文中的图片是通过matplotlib和Seaborn库生成的。

一些例子中的图片是在ipython中直接生成的。

最后，有些图片最好看彩色的。如果在一些电子读物上阅读内容则只能看黑白的。本书的连接如下，link

关于作者

Henrik Brink：在学界和业界具有丰富经验的数据科学家和软件工程师。
Joseph Richards：是一位拥有应用统计和预测分析专业知识的高级数据科学家。与**Henrik Brink**WiS.IO的共同创始人，同时也是工业机器学习解决方案的领先开发商。
Mark Fetherolf ：Nminary Data Science创始人.曾在社会科学研究、化学工程、信息系统性能、容量规划、有线电视和在线广告应用领域担任统计和分析数据库开发人员。

翻译：猛张飞某司人工智能工程师
校对：羊咩咩人类灵魂工程师
交流：
[email protected]

REAL-WORD MACHINE LEANING(翻译本--关于本书)