《利用Python进行数据分析》读书笔记 第1章 准备工作

Python新手一枚,9月份开始接触学习,一眨眼三个月已过,总觉得学习不得章法,碌碌而无所获。自我反思,坚持学习、思考与总结,踏踏实实把知识一点点弄懂才是正解,切不可好高骛远,一口吃成个大胖子!开通此博客就是督促自己,总要留下点印记,不可把时间荒废了。

补充点(红色加粗)


第1章 准备工作

为什么选Python

在数据分析和交互、探索性计算以及数据可视化方面,Python不可避免的接近于其他开源和商业的领域特定编程语言/工具,如R、MATLAB、SAS、Stata等。

作为一个科学计算平台,Python的成功部分源于其能够轻松地集成C、C++以及Fortran代码。 

为什么不选Python

由于Python是一种解释型编程语言,因此大部分Python代码都要比用编译型语言(如Java和C++)编写的代码运行慢得多。

对于高并发、多线程的应用程序而言,Python不是一种理想的编程语言。因为它有一个叫做全局解释器锁(Global Interpreter Lock,GIL)的东西,这是一种防止解释器同时执行多条Python字节码指令的机制。

 解释型编程语言与编译型语言的区别: 

计算机不能理解高级语言,也就不能直接执行高级语言,只能理解机器语言,对于任何语言,都必须翻译成机器语言,才能运行高级语言编写的程序。翻译的方式有两种。

  1. 编译。编译型语言写的程序在执行之前,需要一个专门的编译过程,把程序编译成为机器语言的文件。运行时不需要翻译,所以程序的执行效率高。
  2. 解释。解释型语言的程序不需要编译,省了道工序,在运行程序的时候才翻译。这样每执行一次就要翻译一次,效率比较低。

高级语言与低级语言的区别:

  • 高级语言:实现效率高,执行效率低,对硬件的可控性弱,目标代码大,可维护性好,可移植性好,如java,c,c++,C#,pascal,python,lisp,prolog,FoxPro等;
  • 低级语言:实现效率低,执行效率高,对硬件的可控性强,目标代码小,可维护性差,可移植性差,如机器语言、汇编语言等。

脚本语言:

  1. 脚本语言(JavaScript、VBScript等)介于HTML和C、C++、C#、java等变成语言之间
  2. 与程序语言很多相似的地方。与编程语言最大的区别是编程语言的语法和规则更严格和复杂一些。
  3. 与程序代码的关系:脚本也是一种语言,同样由程序代码组成
  4. 是一种解释型语言
  5. 一般都以文本形式存在,类似于一种命令。

重要的Python库

  • Numpy (Numerical python)
  • pandas (panel data/ python data analysis)
  • matplotlib
  • SciPy (是一组专门解决科学计算中各种标准问题域的包的集合)

安装与设置

用的Windows7系统,安装是个技术活。

集成开发环境(IDE)

Pycharm 集成开发环境安装教程(Windowshttp://www.runoob.com/w3cnote/pycharm-windows-install.html

pycharm 有两个版本,社区版本是免费的,专业版收费,最重要的一个特性就是它对Scikit-learn,matplotlib,numpy,pandas等机器学习库的支持。装的是免费的,专业版也可以装,需要破解,网上也有教程。

Download Windows x86-64 executable installer

安装的时候勾选 path,选择自定义安装路径,默认,确认勾选了pip (用于之后打开扩展安装包)

安装完毕后打开:计算机-属性-高级系统设置-高级-环境变量,确认path里面有Python的安装路径,和pip的安装路径。两个路径都编辑进入path,用;隔开。D:\python37\Scripts\;D:\python37\;C:\Users\Administrator\AppData\Local\Programs\Python\Python37\Scripts;

打开cmd,输入Python,出现如下界面即安装成功。

但是,事情并没有那么简单。当我要用numpy&pandas模块时,用pip装上了,却没办法导入模块,你说气人不?

然后就上网找技术文档啊,发现了Anaconda是个好选择。

致Python初学者:Anaconda入门指南  http://python.jobbole.com/87522/?repeat=w3tc

Anaconda使用总结  http://python.jobbole.com/86236/

PyCharm配置anaconda环境 https://blog.csdn.net/baoxiao7872/article/details/80328224

 

安装总结:

在cmd中用pip3安装numpy&pandas模块,显示成功了,但是使用的时候没办法导入,查原因,说Windows系统装模块会出很多问题,可以下载安装Visio,再继续解决问题。或者推荐使用Anaconda对package进行管理。网上推荐的步骤是先装Anaconda再装pycharm,并且安装Anaconda3的时候会自动一起安装Python3.6。 但是已经安装了Python3.7和pycharm,于是把所有的都卸载,重新安装。

  1. 先安装Anaconda  http://python.jobbole.com/86236/ ,检查是否安装成功,Python和conda版本号是多少,然后对package进行更新。 
  2. 然后安装pycharm,http://www.runoob.com/w3cnote/pycharm-windows-install.html
  3. 最后用PyCharm配置anaconda环境https://blog.csdn.net/baoxiao7872/article/details/80328224

这样可以直接在anaconda下载包,pycharm中直接导入啦!

 

Arcpy 可以方便的调用ArcGIS中的函数和功能,是ArcGIS中自带的非第三方安装包,ArcGIS10.2对应的Python版本为2.7,但是现在用的是Python3.6,如何让两个版本共存,并且能够使arcpy可以运行?

import Arcpy 总结:

第一部分:

  1.  pycharm setting—— project interpreter
  2. project interpreter——C:\Python27\ArcGIS10.2\python.exe
  3. add local 
  4. virtualenv environment:   location:    D:\pycharm_python\py27           base interpreter:python2.7
  5. system interpreter:    C:\python27\ArcGIS10.2\python.exe

第二部分:Edit configuration 

  1. name: 可改
  2. script path:(脚本路径)D:\Python_pycharm\py27\***.py,要选到.py 所在的地方
  3. Python interpreter:Python2.7
  4. working directory:D:\python_pycharm\py27

猜你喜欢

转载自blog.csdn.net/weixin_41041234/article/details/84890589