Linuxの-3.14.12 [カーネルメモリ管理ノートのページテーブルを構築(2)] - 低メモリを作成します。

分析の前へのプレリュードは、設定は、カーネルのページテーブルを確立するために、質問分析に回し、その後、変数を関連するカーネルのページテーブルを構築する準備ができていた説明しています。

)(init_mem_mappingキー機能のカーネル・ページ・テーブルを構築します:

【file:/arch/x86/mm/init.c】
void __init init_mem_mapping(void)
{
    unsigned long end;
 
    probe_page_size_mask();
 
#ifdef CONFIG_X86_64
    end = max_pfn << PAGE_SHIFT;
#else
    end = max_low_pfn << PAGE_SHIFT;
#endif
 
    /* the ISA range is always mapped regardless of memory holes */
    init_memory_mapping(0, ISA_END_ADDRESS);
 
    /*
     * If the allocation is in bottom-up direction, we setup direct mapping
     * in bottom-up, otherwise we setup direct mapping in top-down.
     */
    if (memblock_bottom_up()) {
        unsigned long kernel_end = __pa_symbol(_end);
 
        /*
         * we need two separate calls here. This is because we want to
         * allocate page tables above the kernel. So we first map
         * [kernel_end, end) to make memory above the kernel be mapped
         * as soon as possible. And then use page tables allocated above
         * the kernel to map [ISA_END_ADDRESS, kernel_end).
         */
        memory_map_bottom_up(kernel_end, end);
        memory_map_bottom_up(ISA_END_ADDRESS, kernel_end);
    } else {
        memory_map_top_down(ISA_END_ADDRESS, end);
    }
 
#ifdef CONFIG_X86_64
    if (max_pfn > max_low_pfn) {
        /* can we preseve max_low_pfn ?*/
        max_low_pfn = max_pfn;
    }
#else
    early_ioremap_page_table_range_init();
#endif
 
    load_cr3(swapper_pg_dir);
    __flush_tlb_all();
 
    early_memtest(0, max_pfn_mapped << PAGE_SHIFT);
}

どのprobe_page_size_mask()の実装:

【file:/arch/x86/mm/init.c】
static void __init probe_page_size_mask(void)
{
    init_gbpages();
 
#if !defined(CONFIG_DEBUG_PAGEALLOC) && !defined(CONFIG_KMEMCHECK)
    /*
     * For CONFIG_DEBUG_PAGEALLOC, identity mapping will use small pages.
     * This will simplify cpa(), which otherwise needs to support splitting
     * large pages into small in interrupt context, etc.
     */
    if (direct_gbpages)
        page_size_mask |= 1 << PG_LEVEL_1G;
    if (cpu_has_pse)
        page_size_mask |= 1 << PG_LEVEL_2M;
#endif
 
    /* Enable PSE if available */
    if (cpu_has_pse)
        set_in_cr4(X86_CR4_PSE);
 
    /* Enable PGE if available */
    if (cpu_has_pge) {
        set_in_cr4(X86_CR4_PGE);
        __supported_pte_mask |= _PAGE_GLOBAL;
    }
}

メインロールprobe_page_size_mask()ダイレクトマッピング初期化変数(init_gbpages()内)と設定され、ケース後部タブ決意ためCR4レジスタpage_size_mask可変ページサイズを制御する構成に応じて設定。

戻るinit_mem_mapping()下るを続け、()、ISAバス・デバイス上の上院ISA_END_ADDRESSへのアドレスの終わりを意味しているのinit_memory_mappingが続きます。

init_mem_mapping()の実装:

【file:/arch/x86/mm/init.c】
/*
 * Setup the direct mapping of the physical memory at PAGE_OFFSET.
 * This runs before bootmem is initialized and gets pages directly from
 * the physical memory. To access them they are temporarily mapped.
 */
unsigned long __init_refok init_memory_mapping(unsigned long start,
                           unsigned long end)
{
    struct map_range mr[NR_RANGE_MR];
    unsigned long ret = 0;
    int nr_range, i;
 
    pr_info("init_memory_mapping: [mem %#010lx-%#010lx]\n",
           start, end - 1);
 
    memset(mr, 0, sizeof(mr));
    nr_range = split_mem_range(mr, 0, start, end);
 
    for (i = 0; i < nr_range; i++)
        ret = kernel_physical_mapping_init(mr[i].start, mr[i].end,
                           mr[i].page_size_mask);
 
    add_pfn_range_mapped(start >> PAGE_SHIFT, ret >> PAGE_SHIFT);
 
    return ret >> PAGE_SHIFT;
}

()内の重要な操作をinit_mem_mappingは3 split_mem_range()、kernel_physical_mapping_init()とadd_pfn_range_mapped()関数があります。

ファースト)(split_mem_rangeを分析:

【file:/arch/x86/mm/init.c】
static int __meminit split_mem_range(struct map_range *mr, int nr_range,
                     unsigned long start,
                     unsigned long end)
{
    unsigned long start_pfn, end_pfn, limit_pfn;
    unsigned long pfn;
    int i;
 
    limit_pfn = PFN_DOWN(end);
 
    /* head if not big page alignment ? */
    pfn = start_pfn = PFN_DOWN(start);
#ifdef CONFIG_X86_32
    /*
     * Don't use a large page for the first 2/4MB of memory
     * because there are often fixed size MTRRs in there
     * and overlapping MTRRs into large pages can cause
     * slowdowns.
     */
    if (pfn == 0)
        end_pfn = PFN_DOWN(PMD_SIZE);
    else
        end_pfn = round_up(pfn, PFN_DOWN(PMD_SIZE));
#else /* CONFIG_X86_64 */
    end_pfn = round_up(pfn, PFN_DOWN(PMD_SIZE));
#endif
    if (end_pfn > limit_pfn)
        end_pfn = limit_pfn;
    if (start_pfn < end_pfn) {
        nr_range = save_mr(mr, nr_range, start_pfn, end_pfn, 0);
        pfn = end_pfn;
    }
 
    /* big page (2M) range */
    start_pfn = round_up(pfn, PFN_DOWN(PMD_SIZE));
#ifdef CONFIG_X86_32
    end_pfn = round_down(limit_pfn, PFN_DOWN(PMD_SIZE));
#else /* CONFIG_X86_64 */
    end_pfn = round_up(pfn, PFN_DOWN(PUD_SIZE));
    if (end_pfn > round_down(limit_pfn, PFN_DOWN(PMD_SIZE)))
        end_pfn = round_down(limit_pfn, PFN_DOWN(PMD_SIZE));
#endif
 
    if (start_pfn < end_pfn) {
        nr_range = save_mr(mr, nr_range, start_pfn, end_pfn,
                page_size_mask & (1<<PG_LEVEL_2M));
        pfn = end_pfn;
    }
 
#ifdef CONFIG_X86_64
    /* big page (1G) range */
    start_pfn = round_up(pfn, PFN_DOWN(PUD_SIZE));
    end_pfn = round_down(limit_pfn, PFN_DOWN(PUD_SIZE));
    if (start_pfn < end_pfn) {
        nr_range = save_mr(mr, nr_range, start_pfn, end_pfn,
                page_size_mask &
                 ((1<<PG_LEVEL_2M)|(1<<PG_LEVEL_1G)));
        pfn = end_pfn;
    }
 
    /* tail is not big page (1G) alignment */
    start_pfn = round_up(pfn, PFN_DOWN(PMD_SIZE));
    end_pfn = round_down(limit_pfn, PFN_DOWN(PMD_SIZE));
    if (start_pfn < end_pfn) {
        nr_range = save_mr(mr, nr_range, start_pfn, end_pfn,
                page_size_mask & (1<<PG_LEVEL_2M));
        pfn = end_pfn;
    }
#endif
 
    /* tail is not big page (2M) alignment */
    start_pfn = pfn;
    end_pfn = limit_pfn;
    nr_range = save_mr(mr, nr_range, start_pfn, end_pfn, 0);
 
    if (!after_bootmem)
        adjust_range_page_size_mask(mr, nr_range);
 
    /* try to merge same page size and continuous */
    for (i = 0; nr_range > 1 && i < nr_range - 1; i++) {
        unsigned long old_start;
        if (mr[i].end != mr[i+1].start ||
            mr[i].page_size_mask != mr[i+1].page_size_mask)
            continue;
        /* move it */
        old_start = mr[i].start;
        memmove(&mr[i], &mr[i+1],
            (nr_range - 1 - i) * sizeof(struct map_range));
        mr[i--].start = old_start;
        nr_range--;
    }
 
    for (i = 0; i < nr_range; i++)
        printk(KERN_DEBUG " [mem %#010lx-%#010lx] page %s\n",
                mr[i].start, mr[i].end - 1,
            (mr[i].page_size_mask & (1<<PG_LEVEL_1G))?"1G":(
             (mr[i].page_size_mask & (1<<PG_LEVEL_2M))?"2M":"4k"));
 
    return nr_range;
}

split_mem_range())アライメント動作の開始と終了(すなわちROUND_UPとROUND_DOWN)丸め、および状況に応じて位置合わせからなり、配向と端部の中間部分の開始が(save_mrを使用して、3つのセクションに分割されてメモリに渡さになりますこれは(init_mem_mappingに格納されている)ローカル変数アレイMR。異なるページ・サイズをマッピングすることができる可能にするために、主部分をオフに分割し、オフ分割部分の各々は、それが結合され、マッピングが同じページサイズで、連続している場合。最後に、あなたが印刷情報を見ることができますシェル上でdmesgコマンドを使用して印刷された地図の場合、サンプル:

画像

次に、)(kernel_physical_mapping_initを見て:

【file:/arch/x86/mm/init.c】
/*
 * This maps the physical memory to kernel virtual address space, a total
 * of max_low_pfn pages, by creating page tables starting from address
 * PAGE_OFFSET:
 */
unsigned long __init
kernel_physical_mapping_init(unsigned long start,
                 unsigned long end,
                 unsigned long page_size_mask)
{
    int use_pse = page_size_mask == (1<<PG_LEVEL_2M);
    unsigned long last_map_addr = end;
    unsigned long start_pfn, end_pfn;
    pgd_t *pgd_base = swapper_pg_dir;
    int pgd_idx, pmd_idx, pte_ofs;
    unsigned long pfn;
    pgd_t *pgd;
    pmd_t *pmd;
    pte_t *pte;
    unsigned pages_2m, pages_4k;
    int mapping_iter;
 
    start_pfn = start >> PAGE_SHIFT;
    end_pfn = end >> PAGE_SHIFT;
 
    /*
     * First iteration will setup identity mapping using large/small pages
     * based on use_pse, with other attributes same as set by
     * the early code in head_32.S
     *
     * Second iteration will setup the appropriate attributes (NX, GLOBAL..)
     * as desired for the kernel identity mapping.
     *
     * This two pass mechanism conforms to the TLB app note which says:
     *
     * "Software should not write to a paging-structure entry in a way
     * that would change, for any linear address, both the page size
     * and either the page frame or attributes."
     */
    mapping_iter = 1;
 
    if (!cpu_has_pse)
        use_pse = 0;
 
repeat:
    pages_2m = pages_4k = 0;
    pfn = start_pfn;
    pgd_idx = pgd_index((pfn<<PAGE_SHIFT) + PAGE_OFFSET);
    pgd = pgd_base + pgd_idx;
    for (; pgd_idx < PTRS_PER_PGD; pgd++, pgd_idx++) {
        pmd = one_md_table_init(pgd);
 
        if (pfn >= end_pfn)
            continue;
#ifdef CONFIG_X86_PAE
        pmd_idx = pmd_index((pfn<<PAGE_SHIFT) + PAGE_OFFSET);
        pmd += pmd_idx;
#else
        pmd_idx = 0;
#endif
        for (; pmd_idx < PTRS_PER_PMD && pfn < end_pfn;
             pmd++, pmd_idx++) {
            unsigned int addr = pfn * PAGE_SIZE + PAGE_OFFSET;
 
            /*
             * Map with big pages if possible, otherwise
             * create normal page tables:
             */
            if (use_pse) {
                unsigned int addr2;
                pgprot_t prot = PAGE_KERNEL_LARGE;
                /*
                 * first pass will use the same initial
                 * identity mapping attribute + _PAGE_PSE.
                 */
                pgprot_t init_prot =
                    __pgprot(PTE_IDENT_ATTR |
                         _PAGE_PSE);
 
                pfn &= PMD_MASK >> PAGE_SHIFT;
                addr2 = (pfn + PTRS_PER_PTE-1) * PAGE_SIZE +
                    PAGE_OFFSET + PAGE_SIZE-1;
 
                if (is_kernel_text(addr) ||
                    is_kernel_text(addr2))
                    prot = PAGE_KERNEL_LARGE_EXEC;
 
                pages_2m++;
                if (mapping_iter == 1)
                    set_pmd(pmd, pfn_pmd(pfn, init_prot));
                else
                    set_pmd(pmd, pfn_pmd(pfn, prot));
 
                pfn += PTRS_PER_PTE;
                continue;
            }
            pte = one_page_table_init(pmd);
 
            pte_ofs = pte_index((pfn<<PAGE_SHIFT) + PAGE_OFFSET);
            pte += pte_ofs;
            for (; pte_ofs < PTRS_PER_PTE && pfn < end_pfn;
                 pte++, pfn++, pte_ofs++, addr += PAGE_SIZE) {
                pgprot_t prot = PAGE_KERNEL;
                /*
                 * first pass will use the same initial
                 * identity mapping attribute.
                 */
                pgprot_t init_prot = __pgprot(PTE_IDENT_ATTR);
 
                if (is_kernel_text(addr))
                    prot = PAGE_KERNEL_EXEC;
 
                pages_4k++;
                if (mapping_iter == 1) {
                    set_pte(pte, pfn_pte(pfn, init_prot));
                    last_map_addr = (pfn << PAGE_SHIFT) + PAGE_SIZE;
                } else
                    set_pte(pte, pfn_pte(pfn, prot));
            }
        }
    }
    if (mapping_iter == 1) {
        /*
         * update direct mapping page count only in the first
         * iteration.
         */
        update_page_count(PG_LEVEL_2M, pages_2m);
        update_page_count(PG_LEVEL_4K, pages_4k);
 
        /*
         * local global flush tlb, which will flush the previous
         * mappings present in both small and large page TLB's.
         */
        __flush_tlb_all();
 
        /*
         * Second iteration will set the actual desired PTE attributes.
         */
        mapping_iter = 2;
        goto repeat;
    }
    return last_map_addr;
}

kernel_physical_mapping_init()関数は、キー建物カーネル・ページ・テーブルは、それが物理メモリのマッピングを扱うことです。swapper_pg_dirスペースページ(/arch/x86/kernel/head_32.sから)グローバルカタログAです。アプリケーションから派生スペースのページ・テーブル・ディレクトリ(one_page_table_initを呼び出してから来ている)、およびone_page_table_init()または関係を呼び出して:one_page_table_init() - > alloc_low_page() - > alloc_low_pages() - > memblock_reserve()、最終的なアプリケーションを得ましたおなじみのページグローバルディレクトリエントリは、ここで設定されていると同時に、ここではコードの詳細な分析ではありません。戻る機能ラベルREPEATを持っているkernel_physical_mapping_init()コード、goto文を結合mapping_iterを制御することで、タグ内のコードが2回実行されます。まず実行が、メモリマッピングがhead_32.sと同じ内部に設けられている、ページ属性はPTE_IDENT_ATTRに設定され、2番目の実行については、特定のページ属性は、カーネルに応じて設定され、デフォルトはPAGE_KERNELに設定されていますが、もし後is_kernel_textカーネルコード空間が決定され、それがPAGE_KERNEL_EXECに設定されています。同時に、カーネルのページテーブルの最終的な確立、完全なメモリマップ。

)(最後のキーadd_pfn_range_mappedにinit_memory_mapping()関数呼び出しを続行します。

【file:/arch/x86/mm/init.c】
struct range pfn_mapped[E820_X_MAX];
int nr_pfn_mapped;
 
static void add_pfn_range_mapped(unsigned long start_pfn, unsigned long end_pfn)
{
    nr_pfn_mapped = add_range_with_merge(pfn_mapped, E820_X_MAX,
                         nr_pfn_mapped, start_pfn, end_pfn);
    nr_pfn_mapped = clean_sort_range(pfn_mapped, E820_X_MAX);
 
    max_pfn_mapped = max(max_pfn_mapped, end_pfn);
 
    if (start_pfn < (1UL<<(32-PAGE_SHIFT)))
        max_low_pfn_mapped = max(max_low_pfn_mapped,
                     min(end_pfn, 1UL<<(32-PAGE_SHIFT)));
}

この機能は、主pfn_mappedグローバルアレイ内の物理ページ・フレームにメモリマップの範囲への添加のためであることを特徴とする請求nr_pfn_mappedを示す配列内のエントリの有効数。その結果、指定された物理メモリをマップするかどうかを決定することが可能である、マッピングはカーネル関数pfn_range_is_mappedを繰り返すことにより、状況を避けます。

バック()(memory_map_top_downを呼び出し、それでは他の枝を取って、()memblock.bottom_upの値がまだfalseで返します。この時間memblock_bottom_upをダウン継続する)、参照にISA_END_ADDRESSと最後までinit_mem_mapping。コアが直接max_low_pfn << PAGE_SHIFTを対応させてマッピングされた最後のフレームのアドレスに設定されているエンド。

memory_map_top_down()コードの実装:

【file:/arch/x86/mm/init.c】
/**
 * memory_map_top_down - Map [map_start, map_end) top down
 * @map_start: start address of the target memory range
 * @map_end: end address of the target memory range
 *
 * This function will setup direct mapping for memory range
 * [map_start, map_end) in top-down. That said, the page tables
 * will be allocated at the end of the memory, and we map the
 * memory in top-down.
 */
static void __init memory_map_top_down(unsigned long map_start,
                       unsigned long map_end)
{
    unsigned long real_end, start, last_start;
    unsigned long step_size;
    unsigned long addr;
    unsigned long mapped_ram_size = 0;
    unsigned long new_mapped_ram_size;
 
    /* xen has big range in reserved near end of ram, skip it at first.*/
    addr = memblock_find_in_range(map_start, map_end, PMD_SIZE, PMD_SIZE);
    real_end = addr + PMD_SIZE;
 
    /* step_size need to be small so pgt_buf from BRK could cover it */
    step_size = PMD_SIZE;
    max_pfn_mapped = 0; /* will get exact value next */
    min_pfn_mapped = real_end >> PAGE_SHIFT;
    last_start = start = real_end;
 
    /*
     * We start from the top (end of memory) and go to the bottom.
     * The memblock_find_in_range() gets us a block of RAM from the
     * end of RAM in [min_pfn_mapped, max_pfn_mapped) used as new pages
     * for page table.
     */
    while (last_start > map_start) {
        if (last_start > step_size) {
            start = round_down(last_start - 1, step_size);
            if (start < map_start)
                start = map_start;
        } else
            start = map_start;
        new_mapped_ram_size = init_range_memory_mapping(start,
                            last_start);
        last_start = start;
        min_pfn_mapped = last_start >> PAGE_SHIFT;
        /* only increase step_size after big range get mapped */
        if (new_mapped_ram_size > mapped_ram_size)
            step_size = get_new_step_size(step_size);
        mapped_ram_size += new_mapped_ram_size;
    }
 
    if (real_end < map_end)
        init_range_memory_mapping(real_end, map_end);
}

memory_map_top_down()、最初の使用のmemblock_find_in_rangeメモリを見つけるメモリのPMD_SIZE量(4M)、ページ・テーブル・スペースの確立が十分であることを確認しようとし、その後、ページテーブルの構築を開始、キーの機能はinit_range_memory_mapping達成することである()この関数は:

【file:/arch/x86/mm/init.c】
/*
 * We need to iterate through the E820 memory map and create direct mappings
 * for only E820_RAM and E820_KERN_RESERVED regions. We cannot simply
 * create direct mappings for all pfns from [0 to max_low_pfn) and
 * [4GB to max_pfn) because of possible memory holes in high addresses
 * that cannot be marked as UC by fixed/variable range MTRRs.
 * Depending on the alignment of E820 ranges, this may possibly result
 * in using smaller size (i.e. 4K instead of 2M or 1G) page tables.
 *
 * init_mem_mapping() calls init_range_memory_mapping() with big range.
 * That range would have hole in the middle or ends, and only ram parts
 * will be mapped in init_range_memory_mapping().
 */
static unsigned long __init init_range_memory_mapping(
                       unsigned long r_start,
                       unsigned long r_end)
{
    unsigned long start_pfn, end_pfn;
    unsigned long mapped_ram_size = 0;
    int i;
 
    for_each_mem_pfn_range(i, MAX_NUMNODES, &start_pfn, &end_pfn, NULL) {
        u64 start = clamp_val(PFN_PHYS(start_pfn), r_start, r_end);
        u64 end = clamp_val(PFN_PHYS(end_pfn), r_start, r_end);
        if (start >= end)
            continue;
 
        /*
         * if it is overlapping with brk pgt, we need to
         * alloc pgt buf from memblock instead.
         */
        can_use_brk_pgt = max(start, (u64)pgt_buf_end<<PAGE_SHIFT) >=
                    min(end, (u64)pgt_buf_top<<PAGE_SHIFT);
        init_memory_mapping(start, end);
        mapped_ram_size += end - start;
        can_use_brk_pgt = true;
    }
 
    return mapped_ram_size;
}

あなただけのinit_memory_mapping分析()関数の前にinit_range_memory_mapping()の呼び出しを見ることができる、それがカーネルに直接マッピングされた領域(メモリ不足)ページテーブルの確立を完了します、見ることができます。また、あなたはフロントinit_memory_mapping()関数呼び出しでpgt_buf_endとpgt_buf_topを使用できることに注意して、変数can_use_brk_pgtの設定は、まだページテーブルバッファスペースを使用して、メモリ空間を重複しないようにすることです。しかし、これはkernel_physical_mapping_init 32ビットシステムは、()alloc_low_page()アプリケーションメモリを使用しないので、それが関与していない、場合に表示される64ビットシステムでのみで、32ビットシステム上ではありません。

この時点で、カーネルメモリ不足のページテーブルを設定します。

おすすめ

転載: www.cnblogs.com/linhaostudy/p/11605967.html