python第十周 - 异步IO\数据库\队列\缓存

上节回顾：

　　线程与进程区别？（面试）

进程：是程序动态运行的一种表现形式，是对各种资源的集合

线程：操作系统最小调度单位，不同代码执行路径

进程和线程谁快？

没法比较，进程至少包含一个线程，进程运行后最少启动一个线程

线程之间内存共享，就会出现一个问题，2个线程修改一个数据会出现数据错误

线程同时修改同份数据时必须加锁（互斥锁）

递归锁（多把锁），门中有门

启动线程语法

def run(n)

　　　pass

t_res=[]

for i in range(10)

　　 t = threading.Thread(target=run,args=(n,)) #实例化一个线程

　　 t.start()

t_res.append(t)

t.join() #等待线程执行结果 #上面不是函数，是一次循环，循环结束后t变量值还在 t指最后一次启动的线程执行结果

信号量

同一时间允许多个线程来操作

守护线程(slave) 服务于非守护线程（master），主线程执行完成，守护线程自动消亡

t.setDaemon(True) #必须放在start()前面

t.start()

队列：相当于容器

--作用

1、解耦 2、提高处理效率

--几种模式：

FIFO first in first out

LIFO last in first out

--队列和列表区别

列表数据取了一份相当于复制一份

队列数据取了就没了

--消费者生产者模型

就是通过队列的解耦

Event

红绿灯案例

python多线程不适合cpu密集操作型的任务，适合I/O密集型的任务（I/O操作不占用CPU）

----------------------------------------------------------------------------------------------------------

本节内容

Gevent协程
Select\Poll\Epoll异步IO与事件驱动
Python连接Mysql数据库操作
RabbitMQ队列
Redis\Memcached缓存
Paramiko SSH
Twsited网络框架

引子

到目前为止，我们已经学了网络并发编程的2个套路，多进程，多线程，这哥俩的优势和劣势都非常的明显，我们一起来回顾下

协程

协程，又称微线程，纤程。英文名Coroutine。一句话说明什么是线程：协程是一种用户态的轻量级线程。

协程拥有自己的寄存器上下文和栈。协程调度切换时，将寄存器上下文和栈保存到其他地方，在切回来的时候，恢复先前保存的寄存器上下文和栈。因此：

协程能保留上一次调用时的状态（即所有局部状态的一个特定组合），每次过程重入时，就相当于进入上一次调用的状态，换种说法：进入上一次离开时所处逻辑流的位置。

协程的好处：

无需线程上下文切换的开销（都是在单线程下，不涉及线程间的切换，即不涉及cpu的切换）

"原子操作(atomic operation)是不需要synchronized"，所谓原子操作是指不会被线程调度机制打断的操作；这种操作一旦开始，就一直运行到结束，中间不会有任何 context switch （切换到另一个线程）。原子操作可以是一个步骤，也可以是多个操作步骤，但是其顺序是不可以被打乱，或者切割掉只执行部分。视作整体是原子性的核心。

方便切换控制流，简化编程模型
高并发+高扩展性+低成本：一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。

缺点：

无法利用多核资源：协程的本质是个单线程,它不能同时将单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上.当然我们日常所编写的绝大部分应用都没有这个必要，除非是cpu密集型应用。
进行阻塞（Blocking）操作（如IO时）会阻塞掉整个程序

自己总结：

--协程：

1、用户态线程，cpu不认识协程，是用户自己控制的；线程的切换保存到cpu寄存器里，协程切换保存到自己的寄存器里，cpu不认识它

2、可理解为微线程，单线程下实现并发效果

3、协程之所以能处理大并发，就是把IO操作挤掉了，遇到IO操作就切换，整个程序只有cpu运算

问题：怎么实现IO操作完了就自动切换回去？

使用yield实现简单协程操作例子

 1 import time
 2 import queue
 3 def consumer(name):
 4     print("--->starting eating baozi...")
 5     while True:
 6         new_baozi = yield  #执行到这停止，以后在唤醒会执行下面的语句；
 7         print("[%s] is eating baozi %s" % (name,new_baozi))
 8         #time.sleep(1)
 9  
10 def producer():
11  
12     r = con.__next__()     #为什么调用__next__(),因为consumer第一次调用会变成一个生成器，函数里面有yield,第一次加括号调用会变成生成器，
                              #它还没有真正执行，__next__时候才会真正执行；
13     r = con2.__next__()
14     n = 0
15     while n < 5:
16         n +=1
17         con.send(n)        #send有两个作用，唤醒生成器，同时给它传一个值，传的值就是yield接受到的值
18         con2.send(n)
19         print("\033[32;1m[producer]\033[0m is making baozi %s" %n )
20  
21  
22 if __name__ == '__main__':
23     con = consumer("c1")
24     con2 = consumer("c2")
25     p = producer()

看楼上的例子，我问你这算不算做是协程呢？你说，我不知道啊，你前面说了一堆废话，但是并没告诉我协程的标准形态呀，我定眼一想，觉得你说也对，那好，我们先给协程一个标准定义，即符合什么条件就能称之为协程：

必须在只有一个单线程里实现并发
修改共享数据不需加锁
用户程序里自己保存多个控制流的上下文栈
一个协程遇到IO操作自动切换到其它协程

基于上面这4点定义，我们刚才用yield实现的程并不能算是合格的线程，因为它有一点功能没实现，哪一点呢？

Greenlet

greenlet是一个用C实现的协程模块，相比与python自带的yield，它可以使你在任意函数之间随意切换，而不需把这个函数先声明为generator

#手动切换 
1 from greenlet import greenlet
 2  
 3  
 4 def test1():
 5     print(12)
 6     gr2.switch()
 7     print(34)
 8     gr2.switch()
 9  
10  
11 def test2():
12     print(56)
13     gr1.switch()
14     print(78)
15  
16  
17 gr1 = greenlet(test1)   #启动一个协程
18 gr2 = greenlet(test2)
19 gr1.switch()

上面的greenlet是手动切换，类似于我们开手动挡汽车，还是太low,让我们看下下面的自动切换（Gevent），开自动挡车玩玩

Gevent

Gevent 是一个第三方库，可以轻松通过gevent实现并发同步或异步编程，在gevent中用到的主要模式是Greenlet, 它是以C扩展模块形式接入Python的轻量级协程。 Greenlet全部运行在主程序操作系统进程的内部，但它们被协作式地调度。

 #这里sleep就好比I/O阻塞，遇到阻塞，会立马自动切换
 1 import gevent
 2 
 3 def fun1():
 4     print("黎明在睡觉..zZ")
 5     gevent.sleep(2)
 6     print("黎明还在睡觉.....zzZ")
 7 
 8 def fun2():
 9     print("李佳在偷吃零食")
10     gevent.sleep(1)
11     print("李佳偷吃零食被老师发现了")
12 
13 def fun3():
14     print("王五发现李佳在偷吃零食")
15     gevent.sleep(0)
16     print("王五看见李佳被老师发现在偷笑")
17 
18 
19 gevent.joinall([
20     gevent.spawn(fun1),
21     gevent.spawn(fun2),
22     gevent.spawn(fun3)
23 ])

输出：

黎明在睡觉..zZ
李佳在偷吃零食
王五发现李佳在偷吃零食
王五看见李佳被老师发现在偷笑
李佳偷吃零食被老师发现了
黎明还在睡觉.....zzZ

实现简单的爬取网页

遇到IO阻塞时会自动切换任务

 1 #Author: ls Liu
 2 from urllib import request
 3 import time
 4 import gevent
 5 from gevent import monkey
 6 
 7 monkey.patch_all()   #把当前程序的所有的I/O操作给我单独的做上标记
 8 
 9 def f(url):
10     print("GET %s"%url)
11     resp = request.urlopen(url)
12     data = resp.read()
13     print('%d bytes received from %s.'%(len(data),url))
14 
15 Urls=[
16         'https://www.python.org/',
17         'http://www.sina.com.cn/',
18         'http://www.sohu.com/'
19     ]
20 
21 #同步串行
22 start_time= time.time()
23 for url in Urls:
24     f(url)
25 print("同步下载网页花费时间：",time.time() - start_time)
26 
27 #异步
28 #调试发现通过gevent下载网页和串行急几乎一致，这是为什么呢？
29 #urllib默认和gevent不协调，gevent检测不到urllib的I/O操作，所以会卡主，依旧按照串行执行。那怎么让gevent知道urllib在执行I/O操作呢？ 打个补丁monkey.patch_all
30 async_start_time= time.time()
31 gevent.joinall([
32     gevent.spawn(f, 'https://www.python.org/'),
33     gevent.spawn(f, 'http://www.sina.com.cn/'),
34     gevent.spawn(f, 'http://www.sohu.com/')
35 ])
36 print("异步下载网页花费时间：",time.time() - async_start_time)

通过gevent实现单线程下的多socket并发

server side

 1 import sys
 2 import socket
 3 import time
 4 import gevent
 5  
 6 from gevent import socket,monkey
 7 monkey.patch_all()
 8  
 9  
10 def server(port):
11     s = socket.socket()
12     s.bind(('0.0.0.0', port))
13     s.listen(500)
14     while True:
15         cli, addr = s.accept()
16         gevent.spawn(handle_request, cli)
17  
18  
19  
20 def handle_request(conn):
21     try:
22         while True:
23             data = conn.recv(1024)
24             print("recv:", data)
25             conn.send(data)
26             if not data:
27                 conn.shutdown(socket.SHUT_WR)
28  
29     except Exception as  ex:
30         print(ex)
31     finally:
32         conn.close()
33 if __name__ == '__main__':
34     server(8001)

View Code

client side 　

 1 import socket
 2  
 3 HOST = 'localhost'    # The remote host
 4 PORT = 8001           # The same port as used by the server
 5 s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
 6 s.connect((HOST, PORT))
 7 while True:
 8     msg = bytes(input(">>:"),encoding="utf8")
 9     s.sendall(msg)
10     data = s.recv(1024)
11     #print(data)
12  
13     print('Received', repr(data))
14 s.close()

View Code

import socket
import threading

def sock_conn():

    client = socket.socket()

    client.connect(("localhost",8001))
    count = 0
    while True:
        #msg = input(">>:").strip()
        #if len(msg) == 0:continue
        client.send( ("hello %s" %count).encode("utf-8"))

        data = client.recv(1024)

        print("[%s]recv from server:" % threading.get_ident(),data.decode()) #结果
        count +=1
    client.close()


for i in range(100):
    t = threading.Thread(target=sock_conn)
    t.start()

并发100个socket连接

论事件驱动与异步IO

通常，我们写服务器处理模型的程序时，有以下几种模型：

（1）每收到一个请求，创建一个新的进程，来处理该请求；

（2）每收到一个请求，创建一个新的线程，来处理该请求；

（3）每收到一个请求，放入一个事件列表，让主进程通过非阻塞I/O方式来处理请求

上面的几种方式，各有千秋，

第（1）中方法，由于创建新的进程的开销比较大，所以，会导致服务器性能比较差,但实现比较简单。

第（2）种方式，由于要涉及到线程的同步，有可能会面临死锁等问题。

第（3）种方式，在写应用程序代码时，逻辑比前面两种都复杂。

综合考虑各方面因素，一般普遍认为第（3）种方式是大多数网络服务器采用的方式

看图说话讲事件驱动模型

在UI编程中，常常要对鼠标点击进行相应，首先如何获得鼠标点击呢？
方式一：创建一个线程，该线程一直循环检测是否有鼠标点击，那么这个方式有以下几个缺点：
1. CPU资源浪费，可能鼠标点击的频率非常小，但是扫描线程还是会一直循环检测，这会造成很多的CPU资源浪费；如果扫描鼠标点击的接口是阻塞的呢？
2. 如果是堵塞的，又会出现下面这样的问题，如果我们不但要扫描鼠标点击，还要扫描键盘是否按下，由于扫描鼠标时被堵塞了，那么可能永远不会去扫描键盘；
3. 如果一个循环需要扫描的设备非常多，这又会引来响应时间的问题；
所以，该方式是非常不好的。

方式二：就是事件驱动模型
目前大部分的UI编程都是事件驱动模型，如很多UI平台都会提供onClick()事件，这个事件就代表鼠标按下事件。事件驱动模型大体思路如下：
1. 有一个事件（消息）队列；
2. 鼠标按下时，往这个队列中增加一个点击事件（消息）；
3. 有个循环，不断从队列取出事件，根据不同的事件，调用不同的函数，如onClick()、onKeyDown()等；
4. 事件（消息）一般都各自保存各自的处理函数指针，这样，每个消息都有独立的处理函数；

事件驱动编程是一种编程范式，这里程序的执行流由外部事件来决定。它的特点是包含一个事件循环，当外部事件发生时使用回调机制来触发相应的处理。另外两种常见的编程范式是（单线程）同步以及多线程编程。

让我们用例子来比较和对比一下单线程、多线程以及事件驱动编程模型。下图展示了随着时间的推移，这三种模式下程序所做的工作。这个程序有3个任务需要完成，每个任务都在等待I/O操作时阻塞自身。阻塞在I/O操作上所花费的时间已经用灰色框标示出来了。

在单线程同步模型中，任务按照顺序执行。如果某个任务因为I/O而阻塞，其他所有的任务都必须等待，直到它完成之后它们才能依次执行。这种明确的执行顺序和串行化处理的行为是很容易推断得出的。如果任务之间并没有互相依赖的关系，但仍然需要互相等待的话这就使得程序不必要的降低了运行速度。

在多线程版本中，这3个任务分别在独立的线程中执行。这些线程由操作系统来管理，在多处理器系统上可以并行处理，或者在单处理器系统上交错执行。这使得当某个线程阻塞在某个资源的同时其他线程得以继续执行。与完成类似功能的同步程序相比，这种方式更有效率，但程序员必须写代码来保护共享资源，防止其被多个线程同时访问。多线程程序更加难以推断，因为这类程序不得不通过线程同步机制如锁、可重入函数、线程局部存储或者其他机制来处理线程安全问题，如果实现不当就会导致出现微妙且令人痛不欲生的bug。

在事件驱动版本的程序中，3个任务交错执行，但仍然在一个单独的线程控制中。当处理I/O或者其他昂贵的操作时，注册一个回调到事件循环中，然后当I/O操作完成时继续执行。回调描述了该如何处理某个事件。事件循环轮询所有的事件，当事件到来时将它们分配给等待处理事件的回调函数。这种方式让程序尽可能的得以执行而不需要用到额外的线程。事件驱动型程序比多线程程序更容易推断出行为，因为程序员不需要关心线程安全问题。

当我们面对如下的环境时，事件驱动模型通常是一个好的选择：

程序中有许多任务，而且…
任务之间高度独立（因此它们不需要互相通信，或者等待彼此）而且…
在等待事件到来时，某些任务会阻塞。

当应用程序需要在任务间共享可变的数据时，这也是一个不错的选择，因为这里不需要采用同步处理。

网络应用程序通常都有上述这些特点，这使得它们能够很好的契合事件驱动编程模型。

此处要提出一个问题，就是，上面的事件驱动模型中，只要一遇到IO就注册一个事件，然后主程序就可以继续干其它的事情了，只到io处理完毕后，继续恢复之前中断的任务，这本质上是怎么实现的呢？哈哈，下面我们就来一起揭开这神秘的面纱。。。。

Select\Poll\Epoll异步IO　

http://www.cnblogs.com/alex3714/p/4372426.html　

番外篇 http://www.cnblogs.com/alex3714/articles/5876749.html

select 多并发socket 例子

 1 #_*_coding:utf-8_*_
 2 __author__ = 'Alex Li'
 3 
 4 import select
 5 import socket
 6 import sys
 7 import queue
 8 
 9 
10 server = socket.socket()
11 server.setblocking(0)
12 
13 server_addr = ('localhost',10000)
14 
15 print('starting up on %s port %s' % server_addr)
16 server.bind(server_addr)
17 
18 server.listen(5)
19 
20 
21 inputs = [server, ] #自己也要监测呀,因为server本身也是个fd
22 outputs = []
23 
24 message_queues = {}
25 
26 while True:
27     print("waiting for next event...")
28 
29     readable, writeable, exeptional = select.select(inputs,outputs,inputs) #如果没有任何fd就绪,那程序就会一直阻塞在这里
30 
31     for s in readable: #每个s就是一个socket
32 
33         if s is server: #别忘记,上面我们server自己也当做一个fd放在了inputs列表里,传给了select,如果这个s是server,代表server这个fd就绪了,
34             #就是有活动了, 什么情况下它才有活动? 当然 是有新连接进来的时候 呀
35             #新连接进来了,接受这个连接
36             conn, client_addr = s.accept()
37             print("new connection from",client_addr)
38             conn.setblocking(0)
39             inputs.append(conn) #为了不阻塞整个程序,我们不会立刻在这里开始接收客户端发来的数据, 把它放到inputs里, 下一次loop时,这个新连接
40             #就会被交给select去监听,如果这个连接的客户端发来了数据 ,那这个连接的fd在server端就会变成就续的,select就会把这个连接返回,返回到
41             #readable 列表里,然后你就可以loop readable列表,取出这个连接,开始接收数据了, 下面就是这么干 的
42 
43             message_queues[conn] = queue.Queue() #接收到客户端的数据后,不立刻返回 ,暂存在队列里,以后发送
44 
45         else: #s不是server的话,那就只能是一个 与客户端建立的连接的fd了
46             #客户端的数据过来了,在这接收
47             data = s.recv(1024)
48             if data:
49                 print("收到来自[%s]的数据:" % s.getpeername()[0], data)
50                 message_queues[s].put(data) #收到的数据先放到queue里,一会返回给客户端
51                 if s not  in outputs:
52                     outputs.append(s) #为了不影响处理与其它客户端的连接 , 这里不立刻返回数据给客户端
53 
54 
55             else:#如果收不到data代表什么呢? 代表客户端断开了呀
56                 print("客户端断开了",s)
57 
58                 if s in outputs:
59                     outputs.remove(s) #清理已断开的连接
60 
61                 inputs.remove(s) #清理已断开的连接
62 
63                 del message_queues[s] ##清理已断开的连接
64 
65 
66     for s in writeable:
67         try :
68             next_msg = message_queues[s].get_nowait()
69 
70         except queue.Empty:
71             print("client [%s]" %s.getpeername()[0], "queue is empty..")
72             outputs.remove(s)
73 
74         else:
75             print("sending msg to [%s]"%s.getpeername()[0], next_msg)
76             s.send(next_msg.upper())
77 
78 
79     for s in exeptional:
80         print("handling exception for ",s.getpeername())
81         inputs.remove(s)
82         if s in outputs:
83             outputs.remove(s)
84         s.close()
85 
86         del message_queues[s]
87 
88 select socket server

select socket server

#_*_coding:utf-8_*_
__author__ = 'Alex Li'


import socket
import sys

messages = [ b'This is the message. ',
             b'It will be sent ',
             b'in parts.',
             ]
server_address = ('localhost', 10000)

# Create a TCP/IP socket
socks = [ socket.socket(socket.AF_INET, socket.SOCK_STREAM),
          socket.socket(socket.AF_INET, socket.SOCK_STREAM),
          ]

# Connect the socket to the port where the server is listening
print('connecting to %s port %s' % server_address)
for s in socks:
    s.connect(server_address)

for message in messages:

    # Send messages on both sockets
    for s in socks:
        print('%s: sending "%s"' % (s.getsockname(), message) )
        s.send(message)

    # Read responses on both sockets
    for s in socks:
        data = s.recv(1024)
        print( '%s: received "%s"' % (s.getsockname(), data) )
        if not data:
            print(sys.stderr, 'closing socket', s.getsockname() )

select socket client

select socket client

selectors模块

This module allows high-level and efficient I/O multiplexing, built upon the select module primitives. Users are encouraged to use this module instead, unless they want precise control over the OS-level primitives used.

 1 import selectors
 2 import socket
 3  
 4 sel = selectors.DefaultSelector()
 5  
 6 def accept(sock, mask):
 7     conn, addr = sock.accept()  # Should be ready
 8     print('accepted', conn, 'from', addr)
 9     conn.setblocking(False)
10     sel.register(conn, selectors.EVENT_READ, read)
11  
12 def read(conn, mask):
13     data = conn.recv(1000)  # Should be ready
14     if data:
15         print('echoing', repr(data), 'to', conn)
16         conn.send(data)  # Hope it won't block
17     else:
18         print('closing', conn)
19         sel.unregister(conn)
20         conn.close()
21  
22 sock = socket.socket()
23 sock.bind(('localhost', 10000))
24 sock.listen(100)
25 sock.setblocking(False)
26 sel.register(sock, selectors.EVENT_READ, accept)
27  
28 while True:
29     events = sel.select()
30     for key, mask in events:
31         callback = key.data
32         callback(key.fileobj, mask)

数据库操作与Paramiko模块

http://www.cnblogs.com/wupeiqi/articles/5095821.html

RabbitMQ队列　　

安装 http://www.rabbitmq.com/install-standalone-mac.html

安装python rabbitMQ module

pip install pika
or
easy_install pika
or
源码
  
https://pypi.python.org/pypi/pika

RabbitMQ和PY.queue有什么区别？

　　threading QUEUE：多个线程之间进行数据同步交互，不能跨进程

    进程QUEUE：适用于父进程与子进程间进行交互或者同属于同一父进程下多个子进程进行交互

也就是说如果有两个独立的程序（用py开发），或者python程序和java程序间，或者2台机器间通讯，是不能用进程queue进行通讯，那就需要个中间代理，这个代理就是RabbitMQ

实现最简单的队列通信

send端：

 1 import pika
 2 
 3 #通过实例建立socket
 4 connection = pika.BlockingConnection(pika.ConnectionParameters('localhost'))
 5 #声明一个管道
 6 channel = connection.channel()
 7 
 8 #声明queue
 9 channel.queue_declare(queue='hello')
10 
11 channel.basic_publish(exchange='',
12                       routing_key='hello',    #queue名字
13                       body='Hello World!')   #消息内容
14 
15 print("[x] Sent 'Hello World!'")
16 connection.close()

receive端：

 1 #Author: ls Liu
 2 import pika
 3 connection = pika.BlockingConnection(pika.ConnectionParameters('localhost'))
 4 channel = connection.channel()
 5 
 6 #这里为什么要再声明一次？因为不确定是生产者，消费者哪个先运行，如果消费者先启动，这时queue还没被生成就会报错
 7 channel.queue_declare('hello')
 8 
 9 def callback(ch,method,properties,body):
10     print("-->",ch,method,properties)
11     print("[x] Received %r" %body)
12 
13 #这里只是声明要开始收这个消息
14 channel.basic_consume(#消费消息
15                       callback,    #如果收到消息,就调用callback函数 来处理消息
16                       queue='hello',
17                       no_ack='Truw')
18 
19 print('[*] Waiting for messages.To exit press CTRL+C')
20 channel.start_consuming()  #开始收消息，只要一启动就永远收下去，没有消息就卡住

远程连接rabbitmq server的话，需要配置权限噢

首先在rabbitmq server上创建一个用户

1 sudo rabbitmqctl  add_user alex alex3714

同时还要配置权限，允许从外面访问

sudo rabbitmqctl set_permissions -p / alex ".*" ".*" ".*"

set_permissions [-p vhost] {user} {conf} {write} {read}

vhostThe name of the virtual host to which to grant the user access, defaulting to /.
userThe name of the user to grant access to the specified virtual host.
confA regular expression matching resource names for which the user is granted configure permissions.
writeA regular expression matching resource names for which the user is granted write permissions.
readA regular expression matching resource names for which the user is granted read permission

客户端连接的时候需要配置认证参数

1 credentials = pika.PlainCredentials('alex', 'alex3714')
2  
3  
4 connection = pika.BlockingConnection(pika.ConnectionParameters(
5     '10.211.55.5',5672,'/',credentials))
6 channel = connection.channel()

Work Queues

在这种模式下，RabbitMQ会默认把p发的消息依次分发给各个消费者(c),跟负载均衡差不多

此时，先启动消息生产者，然后再分别启动3个消费者，通过生产者多发送几条消息，你会发现，这几条消息会被依次分配到各个消费者身上

Doing a task can take a few seconds. You may wonder what happens if one of the consumers starts a long task and dies with it only partly done. With our current code once RabbitMQ delivers message to the customer it immediately removes it from memory. In this case, if you kill a worker we will lose the message it was just processing. We'll also lose all the messages that were dispatched to this particular worker but were not yet handled.

But we don't want to lose any tasks. If a worker dies, we'd like the task to be delivered to another worker.

In order to make sure a message is never lost, RabbitMQ supports message acknowledgments. An ack(nowledgement) is sent back from the consumer to tell RabbitMQ that a particular message had been received, processed and that RabbitMQ is free to delete it.

If a consumer dies (its channel is closed, connection is closed, or TCP connection is lost) without sending an ack, RabbitMQ will understand that a message wasn't processed fully and will re-queue it. If there are other consumers online at the same time, it will then quickly redeliver it to another consumer. That way you can be sure that no message is lost, even if the workers occasionally die.

There aren't any message timeouts; RabbitMQ will redeliver the message when the consumer dies. It's fine even if processing a message takes a very, very long time.

Message acknowledgments are turned on by default. In previous examples we explicitly turned them off via the no_ack=True flag. It's time to remove this flag and send a proper acknowledgment from the worker, once we're done with a task.

消费者收到消息后比如需要处理一段时间，在处理时候消费者断电了，宕机了，这时生产者要确认消费者必须把事情处理完了，那消费者处理完就应该给生产者一个确认，处理完了，生产者才能把该消息队列从生产者里消除，现在问题是消费者没处理完就没办法告诉生产者，如何处理？

只要客户端没和它确认，RabbitMQ就不会把消息删掉

只要加上下面的代码就能保证消息被完整的处理

ch.basic_ack(delivery_tag = method.delivery_tag)

1 def callback(ch, method, properties, body):
2     print " [x] Received %r" % (body,)
3     time.sleep( body.count('.') )
4     print " [x] Done"
5     ch.basic_ack(delivery_tag = method.delivery_tag)   #手动确认处理完毕，客户端必须手动和服务端确认
6  
7 channel.basic_consume(callback,
8                       queue='hello')

Using this code we can be sure that even if you kill a worker using CTRL+C while it was processing a message, nothing will be lost. Soon after the worker dies all unacknowledged messages will be redelivered

消息持久化　　

那如果生产者（服务端）宕机挂了呢，那如何保证队列消息还在，不在丢消息？

需要做两步事情：

（1）每次声明队列时，加上durable=True ;

channel.queue_declare(queue='hello', durable=True) #durable只是把队列给持久化了

（2）在服务端消息发送加上 delivery_mode = 2 ； #把消息持久化

channel.basic_publish(exchange='',

routing_key="task_queue",

body=message,

properties=pika.BasicProperties(

delivery_mode = 2, # make message persistent

))

We have learned how to make sure that even if the consumer dies, the task isn't lost(by default, if wanna disable use no_ack=True). But our tasks will still be lost if RabbitMQ server stops.

When RabbitMQ quits or crashes it will forget the queues and messages unless you tell it not to. Two things are required to make sure that messages aren't lost: we need to mark both the queue and messages as durable.

First, we need to make sure that RabbitMQ will never lose our queue. In order to do so, we need to declare it as durable:

channel.queue_declare(queue='hello', durable=True)

Although this command is correct by itself, it won't work in our setup. That's because we've already defined a queue called hello which is not durable. RabbitMQ doesn't allow you to redefine an existing queue with different parameters and will return an error to any program that tries to do that. But there is a quick workaround - let's declare a queue with different name, for exampletask_queue:

channel.queue_declare(queue='task_queue', durable=True)

This queue_declare change needs to be applied to both the producer and consumer code.

At that point we're sure that the task_queue queue won't be lost even if RabbitMQ restarts. Now we need to mark our messages as persistent - by supplying a delivery_mode property with a value 2.

1 channel.basic_publish(exchange='',
2                       routing_key="task_queue",
3                       body=message,
4                       properties=pika.BasicProperties(
5                          delivery_mode = 2, # make message persistent
6                       ))