MemMap内存映射

MemMap内存映射

转载自:https://blog.csdn.net/u014630431/article/details/72844501

一、内存映射文件是由一个文件到一块内存的映射。Win32提供了允许应用程序把文件映射到一个进程的函数 (CreateFileMapping)。内存映射文件与虚拟内存有些类似,通过内存映射文件可以保留一个地址空间的区域,同时将物理存储器提交给此区域,内存文件映射的物理存储器来自一个已经存在于磁盘上的文件,而且在对该文件进行操作之前必须首先对文件进行映射。使用内存映射文件处理存储于磁盘上的文件时,将不必再对文件执行I/O操作,使得内存映射文件在处理大数据量的文件时能起到相当重要的作用。

   基本流程:打开文件--->映射文件到内存----->同步到文件--->关闭

二、原理

  首先,“映射”这个词,就和数学课上说的“一一映射”是一个意思,就是建立一种一一对应关系,在这里主要是只硬盘上文件的位置与进程逻辑地址空间中 一块大小相同的区域之间的一一对应,如图1中过程1所示。这种对应关系纯属是逻辑上的概念,物理上是不存在的,原因是进程的逻辑地址空间本身就是不存在 的。在内存映射的过程中,并没有实际的数据拷贝,文件没有被载入内存,只是逻辑上被放入了内存,具体到代码,就是建立并初始化了相关的数据结构(struct address_space),这个过程有系统调用mmap()实现,所以建立内存映射的效率很高。

                                                                                           图1 内存映射原理

既然建立内存映射没有进行实际的数据拷贝,那么进程又怎么能最终直接通过内存操作访问到硬盘上的文件呢?那就要看内存映射之后的几个相关的过程了。

mmap()会 返回一个指针ptr,它指向进程逻辑地址空间中的一个地址,这样以后,进程无需再调用read或write对文件进行读写,而只需要通过ptr就能够操作 文件。但是ptr所指向的是一个逻辑地址,要操作其中的数据,必须通过MMU将逻辑地址转换成物理地址,如图1中过程2所示。这个过程与内存映射无关。

前面讲过,建立内存映射并没有实际拷贝数据,这时,MMU在地址映射表中是无法找到与ptr相对应的物理地址的,也就是MMU失败,将产生一个缺页中断,缺 页中断的中断响应函数会在swap中寻找相对应的页面,如果找不到(也就是该文件从来没有被读入内存的情况),则会通过mmap()建立的映射关系,从硬 盘上将文件读取到物理内存中,如图1中过程3所示。这个过程与内存映射无关。

如果在拷贝数据时,发现物理内存不够用,则会通过虚拟内存机制(swap)将暂时不用的物理页面交换到硬盘上,如图1中过程4所示。这个过程也与内存映射无关。

三、效率  

从 代码层面上看,从硬盘上将文件读入内存,都要经过文件系统进行数据拷贝,并且数据拷贝操作是由文件系统和硬件驱动实现的,理论上来说,拷贝数据的效率是一 样的。但是通过内存映射的方法访问硬盘上的文件,效率要比read和write系统调用高,这是为什么呢?原因是read()是系统调用,其中进行了数据 拷贝,它首先将文件内容从硬盘拷贝到内核空间的一个缓冲区,如图2中过程1,然后再将这些数据拷贝到用户空间,如图2中过程2,在这个过程中,实际上完成 了 两次数据拷贝 ;而mmap()也是系统调用,如前所述,mmap()中没有进行数据拷贝,真正的数据拷贝是在缺页中断处理时进行的,由于mmap()将文件直接映射到用户空间,所以中断处理函数根据这个映射关系,直接将文件从硬盘拷贝到用户空间,只进行了 一次数据拷贝 。因此,内存映射的效率要比read/write效率高。

                                                                                          图2 read系统调用原理

四、实现

//MemMap.h
#ifndef MEMMAP_H
#define MEMMAP_H
 
#include <stdio.h>
#include <QString>
 
class MemMap
{
public:
    MemMap();
    ~MemMap();
    bool Map(const char* szFileName);
    void UnMap();
 
    const    void* GetData() const { return m_pData; }
    size_t         GetSize() const { return m_uSize; }
private:
    void*     m_pData;
    size_t    m_uSize;
    int       m_nFile;
};
 
#endif // MEMMAP_H
//MemMap.cpp
 
#include "memmap.h"
#include <unistd.h>
#include <fcntl.h>
#include <sys/mman.h>
#include <sys/stat.h>
 
MemMap::MemMap() : m_pData(0), m_uSize(0), m_nFile(0)
{
}
 
MemMap::~MemMap()
{
    UnMap();
}
 
bool MemMap::Map(const char* szFileName)
{
    UnMap();//初始化
    m_nFile = open(szFileName, O_RDONLY); //返回值为int
 
    if (m_nFile < 0)
    {
        m_nFile = 0;
        return false;
    }
 
    struct stat status;
    fstat(m_nFile, &status);
    //qDebug()<<
 
    m_uSize = status.st_size;
    m_pData = mmap(0, m_uSize, PROT_READ, MAP_SHARED, m_nFile, 0); //返回值为void*
    if (MAP_FAILED != m_pData)
    { return true;}
 
    close(m_nFile);
    m_pData = NULL;
    m_nFile = 0;
    m_uSize = 0;
    return false;
}
 
void MemMap::UnMap()
{
    if(m_pData)
    {
        munmap(m_pData, m_uSize);
        m_pData = NULL;
    }
 
    if(m_nFile)
    {
        close(m_nFile);
        m_nFile = 0;
    }
 
    m_uSize = 0;
}

猜你喜欢

转载自blog.csdn.net/SwordArcher/article/details/81867131
今日推荐