Linux块设备驱动

推荐书:《Linux内核源代码情景分析》

1.字符设备驱动和使用中等待某一事件的方法
①查询方式
②休眠唤醒,但是这种没有超时时间
③poll机制,在休眠唤醒基础上加一个超时时间
④异步通知,异步通知实际上就是发信号
⑤输入子系统,这样比较通用

2.块设备相对于字符设备驱动逻辑的变化
①对于硬盘对读写的优化
假如要读磁头0的扇区0,然后写磁头1的扇区0,然后读磁头0的扇区1,若像字符设备那样,就会机械山跳转2次,效率低。
优化:
先不执行,放入队列,优化后再执行,这里的优化是指调整顺序。

②对于flash
假如要写同一个块的扇区0,然后再写扇区1,若是字符设备的做法,写扇区0时需要先把整块读取出来,然后修改此块中
扇区0的数据,然后烧写整个这个块。写扇区1时也是需要先把整块读取出来,然后修改此块中扇区1的数据,然后烧写整个这个块。
优化:
先不执行,放入队列,优化后再执行,这里的优化是指合并相同块的写请求。

所以块设备不能向字符设备一样直接提供读写函数,而是需要先放入队列之中,优化后再执行。


3.块设备驱动程序框架

App:open, read, write "1.txt"
----------------------------------------------- 文件的读写
文件系统:vfat,tfat, ext2, ext3, yaffs2, jffs2 作用:把文件的读写转换为扇区的读写
------------统一的入口:ll_rw_block()---------- 扇区的读写
1.把“读写”放入队列中(可能这一步就有优化)
2.调用队列的处理函数(优化/调整顺序/合并)
块设备驱动程序: 主要是读写块设备函数的实现和属性的提供
-----------------------------------------------
硬件:硬盘,flash,eMMC


4.分析ll_rw_block()

ll_rw_block //fs/buffer.c, 位于fs下,说明是所有文件系统的一个通用的.c文件
    for (i = 0; i < nr; i++)
    submit_bh(op, op_flags, bh); //fs/buffer.c
        struct bio *bio;
        通用的构造请求,使用bio来构造请求
        submit_bio(bio);
            generic_make_request(bio);
                struct request_queue *q = bio->bi_disk->queue; //block/blk-core.c 找对队列
                ret = q->make_request_fn(q, bio); //调用队列的构造请求函数,默认的设置函数是:make_request_fn
                    q->make_request_fn在blk_queue_make_request block/Blk-settings.c中被赋值,
                    blk_queue_make_request在blk_init_allocated_queue block/blk-core.c中被赋值为blk_queue_bio,即make_request_fn=blk_queue_bio
                    blk_queue_bio //默认是这个
                        elv_merge(q, &req, bio) //block/blk-core.c 以电梯调用算法尝试合并这个请求
                        如果合并不成功,调用get_request使用bio构造请求,将请求放入队列中
                            get_request(q, bio->bi_opf, bio, GFP_NOIO);
                            blk_init_request_from_bio(req, bio);
                            blk_flush_plug_list(plug, false);
                            if (q) queue_unplugged(q, depth, from_schedule);                        
                                __blk_run_queue
                                    q->request_fn(q); //调用队列的处理函数,就是块设备驱动实际的读写函数

5.写块设备驱动
1.分配构造struct request_queue,用于提供读写能力
2.设备描述,提供属性
......
====>内核指定了一个结构体:gendisk
驱动框架:
1.分配gendisk: alloc_disk
2.设置
2.1 分配/设置struct request_queue结构,blk_init_queue
2.2 设置gendisk其它信息
3.注册gendisk

6.块设备的操作是以扇区为单位的,内核机制决定的,就算是使用内存模拟的块设备也不例外。

7.对于一块全0的内存模拟的磁盘,未格式化会报"unknow partation table",因为其分区表为空

8.测试
cat /proc/devices 查看设备号
格式化磁盘:# mkfs /dev/ramblock eg: mkdosfs /dev/ramdisk
挂载:# mount /dev/ramblock /tmp
之后就可以通过访问/tmp目录操作磁盘了

9.创建磁盘映像
# cat /dev/ramblock > /ramblock.bin 然后再格式化磁盘再echo进去应该也是可以的。
在Ubuntu里面:# sudo mount -o loop ramblock.bin /mnt loop选项可以把一个普通文件当作块设备进行挂载。loop把它当作一个回环设备。

10.把对内存的操作打印出来可以对比App的读写和实际的IO操作发生的时机的区别。

11.分区
# ls /dev/ramblock* -l 次设备号是0表示整个磁盘,不是分区。起始是0应该是first_minor=0决定的。
# fdisk /dev/ramblock m n p 1(此时显示1-32 sylinder就是驱动中在ramblock_getgeo()中配置的) 1 5,再创建一个分区n p 2 6 32 w
(w表示将配置写到分区表中,分区表就是第一个扇区)
# ls /dev/ramblock* -l 次设备号是0表示整个磁盘,次设备号是1表示第一个主分区,次设备号是2表示第二个主分区。
此时也可以分别格式化每一个主分区:
eg: # mkdosfs /dev/ramblock1
eg: # mkdosfs /dev/ramblock2
分别挂载:
eg: # mount /dev/ramblock1 /mnt
eg: # mount /dev/ramblock2 /tmp
使用# fdisk /dev/ramdisk 报错: Unknow value(s) for: Cylinder 不知道柱面数,fdisk是个老工具了,使用它需要驱动告诉它柱面数信
息(目前很多块设备都不使用这个储存方式了)

12.内存模拟块设备驱动代码

/* 参考: drivers\block\z2ram.c */

#include <linux/module.h>
#include <linux/errno.h>
#include <linux/interrupt.h>
#include <linux/mm.h>
#include <linux/fs.h>
#include <linux/kernel.h>
#include <linux/timer.h>
#include <linux/genhd.h>
#include <linux/hdreg.h>
#include <linux/ioport.h>
#include <linux/init.h>
#include <linux/wait.h>
#include <linux/blkdev.h>
#include <linux/blkpg.h>
#include <linux/delay.h>
#include <linux/io.h>

#include <asm/system.h>
#include <asm/uaccess.h>
#include <asm/dma.h>

static struct gendisk *ramblock_disk;
static request_queue_t *ramblock_queue;

static int major;

static DEFINE_SPINLOCK(ramblock_lock);

#define RAMBLOCK_SIZE (1024*1024)  /*使用1M内存来模拟磁盘*/
static unsigned char *ramblock_buf;

/*这些信息在使用fdisk工具分区的时候会用到*/
static int ramblock_getgeo(struct block_device *bdev, struct hd_geometry *geo)
{
    /* 容量 = heads * cylinders * sectors * 512 */
    geo->heads     = 2;
    geo->cylinders = 32;
    geo->sectors   = RAMBLOCK_SIZE/2/32/512;
    return 0;
}


static struct block_device_operations ramblock_fops = {
    .owner    = THIS_MODULE,
    .getgeo    = ramblock_getgeo,
};


/*目前内核中elv_next_request已经不存在了*/
static void do_ramblock_request(request_queue_t * q)
{
    static int r_cnt = 0;
    static int w_cnt = 0;
    struct request *req;

    //printk("do_ramblock_request %d\n", ++cnt);

    while ((req = elv_next_request(q)) != NULL) {
        /* 数据传输三要素: 源,目的,长度 */
        /* 源/目的: */
        unsigned long offset = req->sector * 512;

        /* 目的/源: */
        // req->buffer

        /* 长度: */
        unsigned long len = req->current_nr_sectors * 512;

        if (rq_data_dir(req) == READ) /*也就是: req->cmd_flags & 1*/
        {
            printk("do_ramblock_request read %d\n", ++r_cnt);
            memcpy(req->buffer, ramblock_buf+offset, len); /*这里是使用memcpy来模拟复杂的IO操作*/
        }
        else
        {
            /*加了这个打印,可以看出来当向设备进行写的时候没有立即调用,而是过来一小会才调用的,
            与算法有关,先放到队列中,然后才执行。

            # cp /etc/fstab /tmp(挂载目录),发现过来一会也没有调用这个函数
            # sync  立即就打印了

            # cp /etc/fstab /tmp  发现没有立即写
            # umount /tmp/ 发现立即打印了
            */
            printk("do_ramblock_request write %d\n", ++w_cnt);
            memcpy(ramblock_buf+offset, req->buffer, len);
        }

        end_request(req, 1);
    }
}

static int ramblock_init(void)
{
    /* 1. 分配一个gendisk结构体 */
    ramblock_disk = alloc_disk(16); /* 次设备号个数: 分区个数+1 */

    /* 2. 设置 */
    /* 2.1 分配/设置队列: 提供读写能力 */
    ramblock_queue = blk_init_queue(do_ramblock_request, &ramblock_lock); /*arg1: 执行实际读写io操作的函数*/
    ramblock_disk->queue = ramblock_queue;

    /* 2.2 设置其他属性: 比如容量 */
    major = register_blkdev(0, "ramblock");  /* cat /proc/devices 看到的是这个文件名吗?*/
    ramblock_disk->major       = major;
    ramblock_disk->first_minor = 0; /*修改它试试*/
    sprintf(ramblock_disk->disk_name, "ramblock"); /*区别设置这两个名字进行测试*/ /*仿照scsi/sd.c sd_format_disk_name测试一下,对比sd卡的,它是什么/dev/下的设备节点名就是什么*/
    ramblock_disk->fops        = &ramblock_fops;
    set_capacity(ramblock_disk, RAMBLOCK_SIZE / 512); /*设置磁盘容量,是以扇区为单位的*/

    /* 3. 硬件相关操作 */
    ramblock_buf = kzalloc(RAMBLOCK_SIZE, GFP_KERNEL); /*这个设备全为0,分区表为空,所以在insmod驱动的时候会报"unknow partation table",需要格式化*/

    /* 4. 注册 */
    add_disk(ramblock_disk);

    return 0;
}

static void ramblock_exit(void)
{
    unregister_blkdev(major, "ramblock");
    del_gendisk(ramblock_disk);
    put_disk(ramblock_disk);
    blk_cleanup_queue(ramblock_queue);

    kfree(ramblock_buf);
}

module_init(ramblock_init);
module_exit(ramblock_exit);

MODULE_LICENSE("GPL");





猜你喜欢

转载自www.cnblogs.com/hellokitty2/p/10162362.html