linux内核分析--内核中的数据结构之队列（二）

内核中的队列是以字节形式保存数据的，所以获取数据的时候，需要知道数据的大小。

如果从队列中取得数据时指定的大小不对的话，取得数据会不完整或过大。

内核中关于队列定义的头文件位于：<linux/kfifo.h> include/linux/kfifo.h

头文件中定义的函数的实现位于：kernel/kfifo.c

内核队列编程需要注意的是：

队列的size在初始化时，始终设定为2的n次方
使用队列之前将队列结构体中的锁(spinlock)释放
1. kfifo概述

kfifo 是内核里面的一个First In First Out数据结构，它采用环形循环队列的数据结构来实现；它提供一个无边界的字节流服务，最重要的一点是，它使用并行无锁编程技术，即当它用于只有一个入队线程和一个出队线程的场情时，两个线程可以并发操作，而不需要任何加锁行为，就可以保证kfifo的线程安全。

 struct kfifo {  
 
        unsignedchar *buffer;    /* the buffer holdingthe data */  
 
        unsignedint size;    /* the size of the allocatedbuffer */  
 
        unsignedint in;    /* data is added at offset (in% size) */  
 
        unsignedint out;    /* data is extracted fromoff. (out % size) */  
 
        spinlock_t*lock;    /* protects concurrentmodifications */  
 
    };

这是kfifo的数据结构，kfifo主要提供了两个操作，__kfifo_put(入队操作)和__kfifo_get(出队操作)。它的各个数据成员如下：
buffer，用于存放数据的缓存

size, buffer空间的大小，在初化时，将它向上扩展成2的幂

lock, 如果使用不能保证任何时间最多只有一个读线程和写线程，需要使用该lock实施同步。

in, out, 和buffer一起构成一个循环队列。 in指向buffer中队尾，而且out指向buffer中的队头，in是数据被开始存放的偏移位置，out是队列开始取出数据的偏移位置。它的结构如示图如下：

+--------------------------------------------------------------+
|           |<----------data---------->|                                   |
+--------------------------------------------------------------+
           ^                                      ^
            |                                       |
            out                                   in

在put和get函数中堆in,out做了很巧妙的处理！

2. kfifo_alloc 分配kfifo内存和初始化工作

 struct kfifo*kfifo_alloc(unsigned int size, gfp_t gfp_mask, spinlock_t *lock)  
    {  
        unsignedchar *buffer;  
        structkfifo *ret;  
        /* 
         * round upto the next power of 2, since our 'let the indices 
         * wrap'tachnique works only in this case. 
         */  
        if (size& (size - 1)) {  
           BUG_ON(size > 0x80000000);  
            size = roundup_pow_of_two(size);  
        }  
        buffer =kmalloc(size, gfp_mask);  
        if(!buffer) 
            returnERR_PTR(-ENOMEM);  
        ret =kfifo_init(buffer, size, gfp_mask, lock);  
        if (IS_ERR(ret))  
           kfree(buffer);       
        returnret;  
    }

这里值得一提的是，kfifo->size的值总是在调用者传进来的size参数的基础上向2的幂扩展，这是内核一贯的做法。这样的好处不言而喻--对kfifo->size取模运算可以转化为与运算，如下：

kfifo->in % kfifo->size 可以转化为 kfifo->in & (kfifo->size – 1)

在kfifo_alloc函数中，使用size & (size – 1)来判断size 是否为2幂，如果条件为真，则表示size不是2的幂，然后调用roundup_pow_of_two将之向上扩展为2的幂。在kfifo_alloc函数中看到调用了kfifo_init函数：

/**
 30  * kfifo_init - allocates a new FIFO using apreallocated buffer
 31  * @buffer: the preallocated buffer to beused.
 32  * @size: the size of the internal buffer,this have to be a power of 2.
 33  * @gfp_mask: get_free_pages mask, passed tokmalloc()
 34  * @lock: the lock to be used to protect thefifo buffer
 35  *
 36  * Do NOT pass the kfifo to kfifo_free() afteruse! Simply free the
 37  * &struct kfifo with kfree().
 38  */
 39 struct kfifo*kfifo_init(unsigned char *buffer, unsigned int size,
 40              gfp_t gfp_mask, spinlock_t *lock)
 41 {
 42     struct kfifo *fifo;
 43
44     /* size must be a power of 2 */
 45     BUG_ON(!is_power_of_2(size));
 46
 47     fifo = kmalloc(sizeof(struct kfifo),gfp_mask);
 48     if (!fifo)
 49         return ERR_PTR(-ENOMEM);
 50
 51     fifo->buffer = buffer;
 52     fifo->size = size;
 53     fifo->in = fifo->out = 0;
 54     fifo->lock = lock;
 55
 56     return fifo;
 57 }

3. __kfifo_put和__kfifo_get，巧妙的入队和出队操作，无锁并发

__kfifo_put是入队操作，它先将数据放入buffer里面，最后才修改in参数；__kfifo_get是出队操作，它先将数据从buffer中移走，最后才修改out。你会发现in和out两者各司其职。

  unsigned int__kfifo_put(struct kfifo *fifo,  
                unsigned char *buffer, unsigned int len)  
    {  
        unsignedint l;  
        len =min(len, fifo->size - fifo->in + fifo->out);       
        /* 
         * Ensurethat we sample the fifo->out index -before- we 
         * startputting bytes into the kfifo. 
         */  
       smp_mb();  
        /* firstput the data starting from fifo->in to buffer end */  
        l =min(len, fifo->size - (fifo->in & (fifo->size - 1)));  
       memcpy(fifo->buffer + (fifo->in & (fifo->size - 1)),buffer, l);   
        /* then putthe rest (if any) at the beginning of the buffer */  
       memcpy(fifo->buffer, buffer + l, len - l);     
        /* 
         * Ensurethat we add the bytes to the kfifo -before- 
         * weupdate the fifo->in index. 
         */      
       smp_wmb();       
        fifo->in+= len;   //每次累加，到达最大值后溢出，自动转为0   
       returnlen;   
    } 
    
    unsigned int__kfifo_get(struct kfifo *fifo,  
 
                unsigned char *buffer, unsigned int len)  
 
   {  
       unsignedint l;  
        len =min(len, fifo->in - fifo->out);  
        /* 
         * Ensurethat we sample the fifo->in index -before- we 
         * startremoving bytes from the kfifo. 
         */  
       smp_rmb();       
        /* firstget the data from fifo->out until the end of the buffer */  
        l =min(len, fifo->size - (fifo->out & (fifo->size - 1)));  
       memcpy(buffer, fifo->buffer + (fifo->out & (fifo->size -1)), l);      
        /* then getthe rest (if any) from the beginning of the buffer */  
       memcpy(buffer + l, fifo->buffer, len - l);  
       /* 
         * Ensurethat we remove the bytes from the kfifo -before- 
         * weupdate the fifo->out index. 
         */       
       smp_mb();       
      fifo->out += len;   //每次累加，到达最大值后溢出，自动转为0     
        returnlen;  
    }

从上面的代码发现，put和get是非常精简的，下面分情况讨论函数的执行过程：

队列的队头队尾下标不受队列长度的限制，就算队头下标大于队列长度，也一样可以使用，原理就在于，数据不是全部放在队头(fifo->out)和队尾(fifo->in)之间的内存空间，而是把超出队头队尾之间长度的数据放到整个队列buffer的开始处

1、入队操作

蓝色部分为真实数据所在内存段，白色部分其实为逻辑上假定的数据所在地，也就是说，为了给用户一种真正的队列感觉——从尾部推进数据，从头部拉取数据，那么就必须让fifo->out和fifo->in只能一直往一个方向推进，但是由于fifo所分配的buffer是有限的一段连续内存，fifo->out和fifo->in迟早要“越界”（这里的越界是in和out大于size，in和out是整数，是相对于buffer的偏移量），入队列的操作，保证fifo->out和fifo->in是一直往右推进的。

如果fifo->in小于buffer->size，那么先放完buffer->size-fifo->in这段内存空间，剩下的部分，转移到buffer的可用空间开头存放；如果fifo->in大于buffer->size，那么直接把要入队列的数据放到buffer可用空间开头。

在put的函数中，有两次取值min和两次memcpy,

情况1、如果fifo->in小于fifo->size,并且in和out都没有越界（都小于size）

那么第一个min中的fifo->size-fifo->in+fifo->out是队列空余的空间大小（这里要求所存放的字符串长度小于队列空余大小）

第二个min中的fifo->in &(fifo->size - 1)是in相对于buffer的偏移位置

如果从in开始到队列末尾便可存放字符串，第一个min取len，第二个min取len，第一个memcpy是从buffer的in开始拷贝len个字符，第二个memcpy拷贝0个字符。

如果从in开始到队列末尾不能存放所有的字符，第一个min取值为len，第二个min取值fifo->size- (fifo->in & (fifo->size - 1)),也就是从in到队列末尾的大小；第一个memcpy是讲队列从in开始到队列末尾填充满，填充的长度也就是l，第二个memcpy是从队列开始填充剩余的len-l长度的字符串。

in累加len的长度，in一直累加，这也是一个巧妙之处，是利用了unsigned int 的回环。

情况2、如果fifo->in小于fifo->size, out没有越界，in超过了size

如果in一旦超多size，那么队列的开头一定存放了数据，并且队列末尾没有空余，将数据存放到对垒开始的地方。

那么第一个min中的fifo->size-fifo->in+fifo->out是队列空余的空间大小

第二个min中的fifo->in& (fifo->size - 1)是in相对于buffer的偏移位置

这个时候fifo->in > fifo->out，但是fifo->in & (fifo->size - 1) < fifo->out

此时需要从队列的开始存放数据，第一个min取len，第二个min取len，因为此时fifo->size- (fifo->in & (fifo->size - 1))肯定小于fifo->size-fifo->in+fifo->out；第一个memcpy是从队列开头的in存放len的字节，第二个memcpy不拷贝字节。

情况3、如果fifo->in小于fifo->size, out没有越界，in和out都超过了size

这种情况的复制情况和上面一样，都是第一次直接拷贝结束。

分析，因为我们只考虑了放，没有考虑取，在取的过程也是Out一直累加，如果累加到超过了unsigned int，那么又从0开始赋值。同时里面关于in和out的操作都是和size取模运算，所以in和out都会在size范围内。这也是笼统的理解，但是这个理解是正确的。

在put的过程中，只要字符串长度小于队列空余空间大小，in和Out无论从数值上怎么越界，第一个min取值为len，第二个min中的fifo->size- (fifo->in & (fifo->size - 1))一定是从in偏移量开始到队列末尾的空余大小，这个值和len相比较，取其中较小者，换句话说，如果从in开始到队列末尾的空余空间长度大于字符串长度，那么第一个memcpy搞定一切，第二个memcpy不再从buffer的头部开始复制数据；如果从in开始到队列末尾的空余空间大小小于字符串长度，那么从in开始的空间先复制满，然后从空开始复制剩余的字符。无论哪种情况都是这个过程。

2、对于get函数

情况1：fifo->in大于fifo->size而fifo->out小于fifo->size（即只有fifo->in“越界”），则先读取fifo->out到fifo->size-1的那一段,大小为l个byte，然后再读取剩下的从buffer开头，大小为len-l个byte的数据（如下图所示，即先读data A段, 再读出data B段）；

情况2：fifo->in和fifo->out都“越界”了，那么l = min(len, fifo->size - (fifo->out & (fifo->size -1))); 这一语句便起作用了，此时fifo->out&fifo->size-1的结果即实际要读的数据所在的内存地址相对于buffer起始地址的偏移值（如下图所示，左边为实际上存在于内存中的data A段, 而右边虚线框为逻辑上的data A段的位置）；

分析：对于get的情况，假设整个过程中fifo->in> fifo->out始终成立，并且假设get的字符串长度始终小于队列总数据的长度，第一个min的取值为min。第二个min中的fifo->size - (fifo->out & (fifo->size - 1))表示从out到队列末尾的字符串长度，如果这段字符串的长度大于len，那么第一个memcpy直接拷贝所要获取的字符串长度，第二个不拷贝，如果小于len的长度，从out开始拷贝到结束，然后从队列的开始拷贝剩余的字符串。

linux内核分析--内核中的数据结构之队列（二）

猜你喜欢