对比《学习R》PDF代码+《R语言实战第2版》PDF代码+《R数据科学》PDF代码分析

R语言是世界上最流行的用于数据处理和统计分析的脚本语言。考古学家用它来跟踪古代文明的传播,医药公司用它来探索哪种药物更安全、更有效,精算师用它评估金融风险以保证市场的平稳运行。总之,在大数据时代,统计数据、分析数据都离不开计算机软件的支持,在这方面R语言尤其出色。

 编写简单的R程序,知道R语言能做什么,使用向量、数组、列表、数据框和字符串等数据类型,掌握条件语句以及分支和循环控制语句,应用R的扩展包,将你自己的工作成果打包发给其他人,清理从各种来源导入的数据,通过可视化和汇总统计理解数据,使用统计模型传递关于数据的定量判断并进行预测,了解编写数据分析代码时出现错误的应对措施。

推荐阅读《学习R》,即使没有任何编程基础,也能顺利阅读,适合夯实基础,尤其是高级循环那一章,简直R的精髓!!

《学习R》高清中文PDF,365页,带目录,文字可复制;《学习R》高清英文PDF,400页,带目录,文字可复制。配套源代码。

下载: https://pan.baidu.com/s/11EpErIPAwOpabOmmY5Ke5w

提取码: 46av

《学习R》分为上下两部分,旨在指导你如何使用R,并提供练习的机会。上半部分主要介绍R的技术细节和使用技巧。

每章都简要介绍了一组不同的数据类型(例如第4章介绍向量、矩阵和数组)或概念(例如第8章介绍分支和循环)。下半部分更侧重实践,展示了从输入数据到发布结果这一标准的数据分析流程。

扫描二维码关注公众号,回复: 7043653 查看本文章

真正的编程入门。没有专门去讲语法,而是在讲案例,做实用工具的过程中,穿插必要的知识,由问题引出语法点。这样读者从一开始就知道所用工具的存在价值,印象必然更深刻。Learn by creating,对初学者来说要比捧一本语法书好许多。

《R语言实战第2版》中文PDF,558页,带书签目录,英文PDF,628页,带书签目录,配套源代码。

下载 https://pan.baidu.com/s/1KC7gutjGh-nhQBDG6ktFRA 
提取码: 6qd9

侧重实践,尽管是一本面向R初学者的书,但里边还有其他好的东西;很好地解决了初学者学会一大把语法细节却不知道如何应用长时间得不到成就感的问题。涉及内容虽多,但都抓住了最本质的部分讲,非常清晰。

在介绍module时又适时地讲了namespace的概念,以及文件和错误。

总而言之,这本书更侧重实践,更重视内容之间的逻辑关联,遵从人们的真实学习过程来编排内容,而不是去刻意地梳理出所谓的知识体系。

数据科学可以将原始数据转化为认识、见解和知识。学习使用R 语言中最重要的数据科学工具。掌握R 语言的精华,并能够熟练使用多种工具来解决各种数据科学难题。

使用最重要的数据科学工具。将数据导入R。这实际上就是读取保存在文件、数据库或Web API 中的数据,再加载到R 的数据框中。如果不能将数据导入R,那么数据科学就根本无从谈起。

 《R数据科学》中文PDF,374页,带书签目录,英文PDF,520页,带书签目录,配套源代码。

下载 https://pan.baidu.com/s/1WGYsWYrGTvnIsBecwEZzLw 
提取码: ddas

导入数据后,就应该对数据进行整理。数据整理就是将数据保存为一致的形式,以满足其所在数据集在语义上的要求。简而言之,如果数据是整洁的,那么每列都是一个变量,每行都是一个观测。整洁的数据非常重要,因为一致的数据结构可以让你将工作重点放在与数据有关的问题上,而不用再费尽心思地将数据转换为各种形式以适应不同的函数。

一旦拥有了整洁的数据,通常下一步就是对数据进行转换。数据转换包括选取出感兴趣的观测(如居住在某个城市里的所有人,或者去年的所有数据)、使用现有变量创建新变量(如根据距离和时间计算出速度),以及计算一些摘要统计量(如计数或均值)。数据整理和数据转换统称为数据处理。 一旦使用需要的变量完成了数据整理,那么生成知识的方式主要有两种:可视化与建模。 这两种方式各有利弊,相辅相成。因此,所有实际的数据分析过程都要在这两种方式间多次重复。

《R语言编程艺术》中文PDF,319页,带书签目录,英文PDF,404页,带书签目录,配套源代码。

下载: https://pan.baidu.com/s/1WNfhVEhE_wQiWAKIDyDgyg
提取码: wuxf

从最基本的数据类型和数据结构开始,到闭包、递归和匿名函数等高级主题,由浅入深,讲解细腻,完全不需要统计学的知识,甚至不需要编程基础。44个扩展案例都是与数据分析相关的,生动展示了R语言在统计学中的高效应用。

R语言的完整语法以及R语言的编程技巧,创建精美图形来展示复杂数据和函数,使用并行计算和向量化的方法编写更高效的代码,? 使用R对C/C++和Python的接口来提高计算速度或增加功能,文本分析、图像处理等领域新的R包,使用高级调试技巧清除代码里恼人的错误,包含许多“扩展案例”,展示完整的、特定用途的函数,并针对同一个问题讨论了不同的设计方案,以便分析高效准确的做法。

 另推荐学习,《数据科学中的R语言》中文PDF+源代码

下载 https://pan.baidu.com/s/1fnv94OmVFnZlJyUU-AXAhA
提取码: c7cb


数据科学是统计学、计算机科学、领域知识的综合,讲了各方面需要用到的技术,还涵盖了最优化方法(最近刚考完记忆犹新),R语言的用法介绍得也很全面

猜你喜欢

转载自www.cnblogs.com/zhxqian/p/11365696.html