Linux系统管理之Python生态工具、文本处理和系统管理

一、Python生态工具

一、Python内置小工具

　　1、秒级启动一个下载服务器

　　Python 内置了一个下载服务器就能够显著提升效率了。例如，你的同事要让你传的文件位于某一个目录下，那么，你可以进入这个目录，然后执行下面的命令启动一个下载服务器：

Python2实现：

    python -m SimpleHTTPServer


Python3实现：

  在 Python 3 中，由于对系统库进行了重新整理，因此，使用方式会有不同：
    python -m http.server

　　执行上面的命令就会在当前目录下启动一个文件下载服务器，默认打开 8000 端口。完成以后，只需要将 IP 和端口告诉同事，让同事自己去操作即可，非常方便高效。

　　效果如下：

　　注意：如果当前目录下存在一个名为 index .html 的文件，则默认显示该文件的内容。如果当前目录下不存在这样一个文件，则默认显示当前目录下的文件列表。

　　2、字符串转换为JSON

　　需求：在工作过程中，我们的系统会调用底层服务的 API。底层服务的 API一般都以 JSON 的格式返回，为了便于问题追踪，我们会将 API 返回的 JSON 转换为字符串记录到日志文件中。当需要分析问题时，就需要将日志文件中的 JSON 字符串拿出来进行分析。这个时候，需要将一个 JSON 字符串转换为 JSON 对象，以提高日志的可读性。

　　解决：这个需求十分常见，以至于使用搜索引擎搜索叮SON”，处于搜索结果的第一项便是“在线 JSON 格式化工具” 。除了打开浏览器，使用在线 JSON 格式化工具以外，我们也可以使用命令行终端的 Python 解释器来解析 JSON 串，如下所示：

# echo '{" job":" developer"," name":" lmx"," s ex":"male " }' |python -m json.tool
{
    " job": " developer",
    " name": " lmx",
    " s ex": "male "
}

　　使用命令行解释器解析JSON 串非常方便，而且，为了便于阅读，该工具还会自动将转换的结果进行对齐和格式化。如下所示：

# echo '{"signing": { "default": { "expiry": "8760h" }, "profiles": { "kubernetes-Soulmate": { "usages": [ "signing", "key encipherment", "server auth", "client auth" ], "expiry": "8760h" } } } }'|python  -m  json.tool
{
    "signing": {
        "default": {
            "expiry": "8760h"
        },
        "profiles": {
            "kubernetes-Soulmate": {
                "expiry": "8760h",
                "usages": [
                    "signing",
                    "key encipherment",
                    "server auth",
                    "client auth"
                ]
            }
        }
    }
}

二、pip的高级用法

　　1、pip常用子命令

　　　　1、pip的子命令对照表

　　　　2、系统安装pip

easy_install pip

　　　　3、查找安装包

pip search flask

　　　　4、安装特定的安装包版本

pip install flask==0.8

　　　　5、删除/卸载安装包

pip uninstall Werkzeug

　　　　6、查看安装包的信息（-f显示安装包所在的目录）

pip show flask

　　　　7、查看安装包的依赖是否完整

pip check flask

　　　　8、列出已安装的包（有两种方法）

　　　　pip list （-o 查询可升级的包）

扫描二维码关注公众号，回复： 82651 查看本文章

　　　　pip freeze

　　　　9、导出系统已安装的安装包列表到 requirements 文件

pip freeze > requirements.txt

　　　　10、从requirements文件安装需要的包

pip install -r requirements.txt

　　　　11、使用pip命令补全

pip completion --bash >~/.profile
$ source ~/.profile

　　　　12、下载包不安装

pip install <包名> -d <目录> 或 pip install -d <目录> -r requirements.txt

　　　　13、打包

pip wheel <包名>

　　　　14、升级指定的包（有两种方式）

pip install -U <包名>
或：pip install <包名> --upgrade

　　　　15、升级pip

pip install -U pip

　　2、加速pip安装的技巧

　　使用Python时间比较长的话，会发现 Python 安装的一个问题，即 pypi.python.org 不是特别稳定，有时候会很慢，甚至处于完全不可用的状态。

　　　　1、使用豆瓣或者阿里云的源加速软件安装

　　我们国内目前有多个pypi镜像，推荐使用豆瓣的镜像源或阿里的镜像源。

国内的镜像源地址：
阿里：https://mirrors.aliyun.com/pypi/simple
豆瓣：http://pypi.douban.com/simple
中国科学技术大学：http://pypi.mirrors.ustc.edu.cn/simple/

　　单次使用安装源：如果要使用第三方的源，只需要在安装时，通过 pip 命令的-i 选项指定镜像源即可。如下所示：（包名放置前后均可）

pip install -i http://pypi.douban.com/simple flask

　　指定全局安装源

　　在unix和macos，配置文件为：$HOME/.pip/pip.conf
　　在windows上，配置文件为：%HOME%\pip\pip.ini

[global]
timeout = 6000
  index-url = http://pypi.douban.com/simple

文件内容

　　　　2、将软件下载到本地部署

　　如果需要对大批量的服务器安装软件包，并且安装包比较多或者比较大，则可以考虑将软件包下载到本地，然后从本地安装。这对于使用脚本部署大量的服务器非常有用，此外，对于服务器无法连接外网的情况，也可以使用这种方法。如下所示：

　　下载到本地

pip install download='pwd' -r requirements.txt

　　本地安装

pip install --no-index -f file.//'pwd' -r requirements.txt

　　使用这种方式，只需要下载一次，就可以多处安装，不用担心网络不稳定的问题。例如，我们通过这种方式下载 Flask 到当前目录下，则 Flask 的依赖 click 、itsdangerous 、 Jinja2、Markup Safe 和 Werkzeug 也会被下载到本地。

pip install --download='pwd' flask

三、Python编辑器

　　1、Linux环境：编辑Python的vim插件

　　vim是一个功能强大、高度可定制的文本编辑器，与Emacs一起成为Linux下最著名的文本编辑器。

　　vim最强大的地方在于快速移动和高度可定制，所以使用vim编写Python代码时，只需要进行简单的定制就能够大幅提高编码效率。

　　　　1、一键执行

　　一键执行功能不是一个插件，而是自定义的vim配置。如果我们写的Python代码是一些较为简单的脚本，那么，这个一键执行的功能会非常实用。将下面的配置放在vim的配置文件当中，编写完Python代码以后，按F5就实现了一键执行功能。该功能最实用的是编写单元测试，写完测试不用退出vim，立即执行就能看到结果，非常方便。

　　配置连接地址：https://blog.csdn.net/u010871058/article/details/54253774

　　vimPython配置版：https://www.cnblogs.com/cjy15639731813/p/5886158.html

　　　　2、代码补全插件snipmate

　　代码补全能够显著减少敲键的次数，将我们从琐碎的语法中解放出来。毫不夸张地说，代码补全插件能够帮我们写一半的代码。例如，使用snipmate插件，输入ifmain后按tab键将会自动生成下面的代码：

　　　　3、语法检查插件 Syntastic

　　Syntastic是一款强大的语法检查插件，当我们保存源文件时，它就会执行。执行完以后，会提示我们哪些代码存在语法错误，哪些代码不符合编码规范，并给出具体的提示信息。例如，Python代码风格默认设置为PEP8，即使我们不太了解PEP8的代码风格，只要使用了Syntastic插件，并根据它给出的提示进行修改，就能够写出完全符合PEP8风格的代码。

　　　　4、编程提示插件jedi-vim

　　jedi-vim是基于jedi的自动补全插件，与snipmate不同的是，该插件更加智能。jedi-vim更贴切的称呼是“编程提示”，而不是代码补全插件。需要注意的是，使用jedi-vim插件前需要在电脑中安装jedi。这个插件是Python的标配。

　　jedi是一个自动补全和静态分析的Python库，直接使用pip安装即可：

pip install jedi

　　使用jedi-vim编写Python的代码效果图

　　2、Windows环境：Python编辑器PyCharm介绍

　　PyCharm是由JetBrains打造的一款功能强大的Python IDE 也是目前最流行的 Python IDE。JetBrains是捷克一家软件开发公司，该公司最为人熟知的产品是一款名为 IntelliJ IDEA的Java IDE 。IntelliJ IDEA是Eclipse最大的竞争对手，并且，不少资深的软件工程师都认为，IntelliJ IDEA 比 Eclipse更加智能、更加好用。可以看到，JetBrains 算得上是一家历史悠久的开发编辑器的公司，正因为该公司在编辑器领域的多年沉淀、对编辑器的易用性有深刻的理解和独到的见解，使得PyCharm一经推出就受到了Python工程师的广泛关注。

　　PyCharm是一款很现代的编辑器，几乎包含了所有现代编辑器应有的功能：

代码补全；
代码高亮；
项目管理；
智能提示；
代码风格检查；
集成单元测试；
集成版本控制工具；
图形界面调试；
方便的重构工具；
快捷键支持；
大量的插件。

四、Python代码规范检查

　　Python 官方给出的编码规范 PEP 8 ，然后介绍检查代码是否符合规范的工具 pycodestyle ，以及可以将代码风格格式化成 PEP 8 的 autopep8 。

　　1、PEP 8编码规范

　　　　1、PEP 8编码规范介绍

　　Python代码给人的第一印象就是颜值高、简洁优美、可读性强。这一方面是因为Python语言自身的优秀设计，如通过统一的缩进来表示代码块，通过减少多余的符号使得代码更加简洁；另一方面是因为Python代码有着较为统一的编码风格。

　　PEP 8本身只是编码风格方面的建议，并不强制工程师遵循。但是，由于该建议被Python工程师广泛接纳，因此，它已经成为了事实上的标准。

　　PEP8编码规范详细地给出了Python编码的指导，包括对齐规则、包的导人顺序、空格与注释、命名习惯和异常处理等Python编程的方方面面，并且提供了详细的示例。

　　　　2、PEP 8编码规范指导手册

　　官网手册：https://www.python.org/dev/peps/pep-0008/

　　中文手册：https://blog.csdn.net/ratsniper/article/details/78954852

　　　　3、注意事项

　　在Python2中，相对导入又可以分为显式相对导入和隐式相对导入，而在Python3中，已经弃用了隐式相对导入。

　　Python中支持相对导人和绝对导人，推荐使用绝对导人。因为绝对导人可读性更好，也不容易出锚，即使出错也会给出更加详细的错误信息。

　　2、使用pycodestype检查代码规范

　　Python官方的代码规范称为PEP8，这个检查代码风格的命令行工具叫阴间，很容易引起困惑。因此，Python之父提议将pep8这个命令行工具重命名为 pycodestyle。

　　　　1、安装相关的插件

pip install peps
pip install pycodestyle

　　　　2、对一个或多个文件运行 pycodestyle

方式一：
　　pycodestyle --first optparse.py
方式二：
　　pep8 optparse.py

　　　　3、显示不规范的源代码

pycodestyle --show-source --show-pep8 test.py

　　3、使用autopep8将代码格式化

　　　　1、autopep8简介

　　autopep8是一个开源的命令行工具，它能够将Python代码自动格式化为PEP8风格。autopep8使用pycodestyle工具来决定代码中的哪部分需要被格式化，这能够修复大部分pycodestyle工具中报告的排版问题。autopep8本身也是一个Python语言编写的工具。

　　　　2、安装autopep8

pip install autopep8

　　　　3、autopep8的使用

autopep8 --in-place optparse.py

　　--in-place参数类似于sed的-i参数，直接将修改结果保存到源文件中。若不加--in-place则只将结果输出到控制台，不修改源文件。
　　autopep8 还存在--aggressive选项，使用该选项会执行更多实质性的更改，可以多次使用以达到更佳的效果

五、Python工作环境管理

　　Python2和Python3之间存在着较大的差异，并且，由于各种原因导致了Python2和Python3的长期共存。在实际工作过程中，我们可能会同时用到Python2和Python3，因此，需要经常在Python2和Python3之间进行来回切换。

　　这涉及到两个工具：pyenv和virtualenv。pyenv用于管理不同的Python版本，virtualenv用于管理不同的工作环境。

　　部署应用：https://blog.csdn.net/lyintong/article/details/68491351

　　1、注意pyenv和virtualenv的区别

　　pyenv用以管理不同的Python版本，例如，你的系统工作时使用Python2.7.13，学习时使用Python3.6.0。

　　virtualenv用以隔离项目的工作环境，例如，项目A和项目B都是使用Python2.7.13，但是，项目A需要使用Flask0.8版本，项目B需要使用Flask0.9版本。

　　我们只要组合pyenv和virtualenv这两个工具，就能够构造Python和第三方库的任意版本组合，拥有很好的灵活性，也避免了项目之间的相互干扰。

　　virtualenv本身是一个独立的工具，用户可以不使用pyenv而单独使用virtualenv。但是，如果你使用了pyenv，就需要安装pyenv-virtualenv插件，而不是通过virtualenv软件使用virtualenv的功能。

　　2、使用pyenv管理不同的Python版本

　　　　1、pyenv简介

　　pyenv是一个Python版本管理工具，它能够进行全局的Python版本切换，也可以为单个项目提供对应的Python版本。使用pyenv以后，可以在服务器上安装多个不同的Python版本，也可以安装不同的Python实现。不同Python版本之间的切换也非常简单。

　　　　2、pyenv的安装

1、选择安装到$HOME/.pyenv目录
git clone https://github.com/yyuu/pyenv.git ~/.pyenv

2、配置环境变量
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> /etc/profile  
echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >>/etc/profile

3、使环境变量立即生效
source /etc/profile

　　　　3、pyenv的使用

1、查看一下有哪些版本的python 可以安装 
pyenv  install --list

2、安装指定版本的Python
pyenv install -v 2.7.1  
pyenv install -v 3.6.1

3、卸载指定版本的Python
pyenv uninstall 2.7.1

4、查看所有的Python版本
pyenv versions

5、查看当前操作的Python版本
pyenv version

　　注意：

system 代表当前系统的python 版本
全局环境下的python不会自动加载到pyenv下,一定要自己再安装一次各个版本的python

　　3、使用virtualenv管理不同的项目

　　　　1、virtualenv简介

　　virtualenv 本身是一个独立的项目，用以隔离不同项目的工作环境。

　　用户需求：用户希望在项目A中使用Flask0.8这个版本，与此同时，又想在项目B中使用Flask0.9这个版本。如果我们全局安装Flask，必然无法满足用户的需求。这个时候，我们就可以使用virtualenv。

　　我们只要组合pyenv和virtualenv这两个工具，就能够构造Python和第三方库的任意版本组合，拥有很好的灵活性，也避免了项目之间的相互干扰。

　　　　2、pyenv-virualenv的安装

git clone https://github.com/yyuu/pyenv-virtualenv.git
echo 'eval "$( pyenv virtualenv - init -) "'>>/etc/profile
source /etc/profile

　　　　3、pyenv-virualenv的使用

　　有了pyenv-virtualenv以后，我们可以为同一个Python解释器，创建多个不同的工作环境。例如，我们新建两个工作环境：

pyenv virtualenv 2.7.13 first_project
pyenv virtualenv 2.7.13 second_project

　　使用virtualenvs指明了查看工作环境

pyenv virtualenvs

　　进入/退出/删除virtualenv虚拟环境

1、activate进入一个工作环境
pyenv activate first_project

2、deactivate退出一个工作环境
pyenv deactivate first_project

3、virtualenv-delete删除虚拟环境
pyenv virtualenv-delete first_project

二、文本处理

一、Jinja2

　　中文文档：https://www.kancloud.cn/manual/jinja2/70423

　　1、模板介绍

　　模板在Python的web开发中广泛使用，它能够有效地将业务逻辑和页面逻辑分离，使得工程师编写出可读性更好、更加容易理解和维护的代码。
　　web开发是最需要使用模板的地方，但是，并不是唯一可以使用模板的地方。模板使用范围比大多数工程师接触的都要广泛，因为模板适合所有基于文本的格式，如HTML,XML,CSV,LaTeX等。
　　使用模板能够编写出可读性更好、更容易理解和维护的代码，并且使用范围非常广泛，因此怎么使用模板主要取决于工程师的想象力和创造力。例如，本书第十章即将介绍的Ansible就使用Jinja2来管理配置文件。
　　作为工程师，我们也可以使用Jinja2管理工作中的配置文件。一旦学会使用模板管理配置文件，就可以摆脱无数琐碎的文本替换工作。

　　Python自带的模板功能非常有限，例如无法在模板中使用控制语句和表达式，不支持继承和重用等操作。这对于web开发来说远远不够，因此，出现了第三方的模板系统。目前市面上有非常多的模板系统，其中最知名的是Jinja2和Mako。

　　2、Jinja2语法入门

　　Jinja2是Flask作者开发的一个模板系统，起初是仿Django模板的一个模板引擎，为Flask提供模板支持。但是，由于其灵活、快速和安全等优点被广泛使用。

　　　　1、Jinja2模板引擎之所以使用广泛，是因为它具有以下优点：

相对于Template,Jinja2更加灵活，它提供了控制结构、表达式和继承等，工程师可以在模板中做更多的事情；
相对于Mako,Jinja2提供了仅有的控制结构，不允许在模板中编写太多的业务逻辑，避免了工程师乱用行为；
相对于Django模板，Jinja2的性能更好；
Jinja2模板的可读性很好。

　　　　2、Jinja2是Flask的一个依赖，如果已经安装了Flask,Jinja2也会随之安装。当然，也可以单独安装Jinja2

pip install jinja2

　　　　3、语法块

　　在jinja2中，存在三种语法：

1 控制结构 {% %}
2 变量取值 {{ }} 
3 注释    {# #}

　　范例

{% block body %}
  <ul>
  {% for user in users %}
    <li><a href="{{ user.url }}">{{ user.username }}</a></li>
  {% endfor %}
  </ul>
{% endblock %}

　　　　4、变量

　　Jinja2模板中使用的 {{ }} 语法表示一个变量，它是一种特殊的占位符，告诉模板引擎这个位置的值在渲染模板时获取。Jinja2识别所有的Python数据类型，甚至是一些复杂的类型，如列表、字典和对象等

　　　　5、Jinja2的过滤器

　　变量可以通过“过滤器”进行修改，过滤器可以理解为是Jinja2里面的内置函数和字符串处理函数。

　　Jinja2比较常用的过滤器：

　　在Jinja2中，变量可以通过“过滤器”修改，过滤器与变量用管道(|)分割。多个过滤器可以链式调用，前一个过滤器的输出会作为后一个过滤器的输入。如下所示：

　　　　6、Jinja2的控制结构

　　Jinja2中的if语句类似于Python中的if语句，但是，需要使用endif语句作为条件判断的结束。我们可以使用if语句判断一个变量是否定义，是否为空，是否为真值。与Python中的if语句一样，也可以使用elif和else构建多个分支，如下所示：

　　　　7、Jinja的for循环

　　Jinja2中的for语句可用于迭代Python的数据类型，包括列表、元组和字典。在Jinja2中不存在while循环，这也符合了Jinja2的“提供仅有的控制结构，不允许在模板中编写太多的业务逻辑，避免了工程师乱用行为”设计原则。

　　除了基本的for循环使用以外，Jinja2还提供了一些特殊的变量，我们不用定义就可以直接使用这些变量。列出了Jinja2循环中可以直接使用的特殊变量。

　　　　6、Jinja2的宏

　　Jinja2宏的简单使用：http://makaidong.com/printN/3301_768547.html

　　Jinja2宏问题解决：https://blog.csdn.net/qq_34062683/article/details/78234695

　　宏类似于语言中的函数，用于将行为抽象成可重复调用的代码块。与函数一样。宏分为定义与调用两个阶段。

　　在宏的定义中，使用macro关键字定义一个宏，input是宏的名称。它有三个参数，分别是name,type和value，其中type和value参数有默认值。可以看到宏的定义与Python的函数定义非常相似，此外，它与Jinja2中的for循环和if语句一样，不需要使用复合语句的冒号，使用endmacro结束宏的定义。
　　下面是宏的调用，与函数调用类似：

import jinja2
rules={
"name":"xxxxxxx",
"rules":[
    {
        "alert": "z1",
        "expr": "up == 0",
        "duration": "1m",
        "enable": 1,
        "labels":{"labels1":"label1","label2":"label2"},
        "annotations":{"annotations":"annotations"}
    },
    {
        "alert": "z2",
        "expr": "up == 0",
        "duration": "1m",
        "enable": 1,
        "labels":{"label1":"label1","label2":"label2"},
        "annotations":{"annotation1":"annotation1", "annotation2":"annotation2"}
    }
],
"desc":"group DESC NEW1"
}
RENDER_RULES_TEMPLATE = """groups:
- name: {{ rules.name }}
  rules:
{%- for alert in rules.rules %}
  - alert: {{ alert.alert }}
    expr: {{ alert.expr}}
    for: {{ alert.duration }}
    labels:
  {%- for item in alert.labels %}
      {{ item }}: {{ alert.labels[item] }}
  {%- endfor %}
    annotations: 
  {%- for item in alert.annotations %}
      {{ item }}: {{ alert.annotations[item] }}
  {%- endfor %}
{% endfor %}
"""
result = jinja2.Template(source=RENDER_RULES_TEMPLATE).render(rules=rules)
with open('result.yml','w') as fp:
    fp.write(result)

jinja2宏应用：创建yaml文件

　　　　9、Jinja2的集成和super函数

　　若只是使用Jinja2进行配置文件管理，基本用不到Jinja2的继承功能。若使用Jinja2进行web开发。

　　Jinja2中最强大的部分就是模板继承。模块继承允许你构建一个包含站点共同元素的基本模板“骨架”，并定义子模块可以覆盖的块。

三、Linux系统管理

一、文件读写

　　1、Python内置的open函数

　　文件打开的模式

　　操作示例

f = open('data1.txt','w',encoding='utf-8')

# print(f.read())
f.write('hello, world')
f.close()

　　2、避免文件句柄泄露：使用try....finally

　　使用try....finally

try:
    f = open('data.txt',encoding='utf-8')
    print(f.read())
finally:
    f.close()

　　对于文件打开、处理、再关闭的逻辑，使用上下文管理器的代码（使用with语句）：

with open('data.txt',encoding='utf-8') as f:
    print(f.read())

　　3、常见的文件操作函数

　　Python的文件对象有多种类型的函数，如刷新缓存的flush函数，获取文件位置的tell函数，改变文件读取偏移量的seek函数。

　　　　1、Python中读的相关函数

read ：读取文件中的所有内容；
readline ：一次读取一行；
readlines ：将文件内容存到一个列表中，列表中的每一行对应于文件中的一行。

　　read 函数和 readlines 函数都是一次就将所有内容读入到内存中。处理的是小文件还是可以的，若大文件，占用内存太多，甚至会出现Out-Of-Memory错误。所以避免这样操作。

　　　　2、Python中写的相关函数

write：写字符串到文件中，并返回写入的字符数；
writelines：写一个字符串列表到文件中。

　　在Python中，除了使用文件对象的write函数和writelines函数向文件写入数据以外，也可以使用print函数将输出结果输出到文件中。print函数比write和writelines函数更加灵活。

# 导入功能模块
from __future__ import print_function

with open('data.txt','w') as f:
    print(1, 2, 'hello world', sep=",", file=f)

　　4、Python的文件是一个可迭代对象

　　Python的for循环不但可以遍历如字符串、列表、元组这样的可迭代徐磊，还可以使用迭代器协议遍历可迭代对象。Python的文件对象实现了迭代器协议。

with open('data.txt') as inf:
    for line in inf:
        print(line.upper())

　　5、案例：将文件中所有单词的首字母变成大写

　　　　1、实现方式一：with语句

with open('data.txt') as inf, open('out.txt', 'w') as outf:
    for line in inf:
        outf.write(" ".join([word.capitalize() for word in line.split()]))
        outf.write("\n")

　　　　2、实现方式二：print函数来简化输出语句

from __future__ import print_function

with open('data.txt') as inf, open('out_print.txt', 'w') as outf:
    for line in inf:
        print(*[word.capitalize() for word in line.split()], file=outf)

二、文件与文件路径管理

　　1、知识点连接

　　详情见Python的os模块：http://www.cnblogs.com/happy-king/p/7704487.html#_label4

　　2、案例：打印最常用的10条Linux命令

　　当我们在Shell中输入命令并执行时，有非常多的快捷键可以提高我们的工作效率。例如，我们可以在Bash中使用ctrl+r搜索曾经执行过的Linux命令，之所以可以使用ctrl+r搜索曾经执行过的Linux命令是因为Bash跟踪用户之前输入过的命令，并将其保存在~./bash_history文件中。我们可以使用history命令或者直接读取~./bash_history文件的内容来查看命令历史。

　　搜索历史命令的快捷键：ctrl+r

　　统计每条命令的出现次数，然后找出出现次数最多的10条命令。

 1 import os
 2 from collections import Counter
 3 
 4 c = Counter()
 5 with open(os.path.expanduser('~/.bash_history')) as f:
 6     for line in f:
 7         cmd = line.strip().split()
 8         if cmd:
 9             c[cmd[0]] += 1
10 
11 
12 CmdCount=c.most_common(10)
13 print(CmdCount)

Python3实现

三、文件内容管理

　　系统管理员在管理服务器时，可能会有这样的疑问：

两个目录中的文件到底有什么差别
系统中有多少重复文件存在
如何找到并删除系统中的重复文件

　　1、目录和文件比较：filecmp模块

　　　　1、cmp函数

　　filecmp模块最简单的函数是cmp函数，该函数用来比较两个文件是否相同，如果文件相同，返回True，否则返回False。

　　　　2、cmpfiles函数

　　cmpfiles函数用来同时比较两个不同目录下的多个文件，并且返回一个三元组，分别包含相同的文件、不同的文件和无法比较的文件。

　　cmpfiles函数用来同时比较两个目录下的文件，也可以使用该函数比较两个目录。但是，在比较两个目录时需要通过参数指定所有可能的文件，显然比较繁琐。

　　　　3、dircmp函数

　　调用dircmp函数以后会返回一个dircmp类的对象，该对象保存了诸多属性，工程师可以通过读取这些属性的方式获取目录之间的差异。

　　filecmp 模块的 dircmp 函数仅仅比较目录下面的文件和子目录，但是，并不会递归比较子目录的内容。对于目录， dircmp 函数也仅仅是比较函数的名称，不会去比较子目录里面的内容。

　　2、使用Python管理压缩包　　

　　shutil模块：http://www.cnblogs.com/happy-king/p/7704487.html#_label6