Principle and Realization of ARM Architecture Processor Mechanism in Linux Operating System

The concept of ARM

ARM (Advanced RISC Machine) can be considered not only the name of a company, but also a general term for a type of microprocessor, or the name of a technology.

ARM does not produce or sell chips, it only sells chip technology licenses. Its cooperative companies match various hardware components according to different needs, such as UART, SDI, I2C, etc., so as to design different SoC chips.

Application Scenarios for ARM

ARM-based processors have the advantages of high speed, low power consumption, and low price, and are widely used in the following fields:

  • Provide an open application platform that can run complex operating systems for products such as communications, consumer electronics, and imaging equipment;

  • Provide real-time embedded applications in the fields of mass storage, automotive electronics, industrial control and network applications;

  • Security systems such as credit cards, SIM cards, etc.

Technical characteristics of ARM

The ARM architecture supports 32-bit ARM instruction set and 16-bit Thumb instruction set (greatly reduces code storage space).

Here is an example to explain the characteristics between the architecture, core, processor and chip: S3C2440, this is a SoC chip, note that it is not a cpu.

The 2440 is somewhat similar to the 51 single-chip microcomputer we are familiar with, both of which are embedded. The development of embedded has gone through three stages so far, namely SCM, MCU, and SoC.

51 belongs to SCM or MCU, and 2440 belongs to SoC. Let's take a look at the internal structure of 51 MCU first.

Its internal structure can be simply divided into two parts: cpu and peripherals.

Let's take a look at the internal structure of 2440:

arm920t is its processor. In my opinion, processor and core are one concept here, but one is a hard concept and the other is a soft concept. The 920t here is both a processor and a core. What Samsung does is other things except this cpu.

RM version series

ARM version Ⅰ: V1 version architecture.

This version of the architecture only appeared in the prototype ARM1, which only has a 26-bit addressing space and is not used in commercial products.

Its basic properties are:

  • Basic data processing instructions (no multiplication);

  • Byte, halfword and word based Load/Store instructions;

  • Transfer instructions, including subroutine calls and link instructions;

  • 供操作系统使用的软件中断指令SWI; 寻址空间:64MB(226)。

ARM版本Ⅱ: V2版架构

该版架构对V1版进行了扩展,例如ARM2和ARM3(V2a)架构。包含了对32位乘法指令和协处理器指令的支持。 版本2a是版本2的变种,ARM3芯片采用了版本2a,是第一片采用片上Cache的ARM处理器。同样为26位寻址空间,现在已经废弃不再使用。

V2版架构与版本V1相比,增加了以下功能:

  • 乘法和乘加指令;

  • 支持协处理器操作指令;

  • 快速中断模式;

  • SWP/SWPB的最基本存储器与寄存器交换指令;

  • 寻址空间:64MB。

ARM版本Ⅲ : V3版架构

ARM作为独立的公司,在1990年设计的第一个微处理器采用的是版本3的ARM6。它作为IP核、独立的处理器、具有片上高速缓存、MMU和写缓冲的集成CPU。 变种版本有3G和3M。版本3G是不与版本2a向前兼容的版本3,版本3M引入了有符号和无符号数乘法和乘加指令,这些指令产生全部64位结果。

V3版架构( 目前已废弃 )对ARM体系结构作了较大的改动:

  • 寻址空间增至32位(4GB);

  • 当前程序状态信息从原来的R15寄存器移到当前程序状态寄存器CPSR(Current Program Status Register)中;

  • 增加了程序状态保存寄存器SPSR(Saved Program Status Register);

  • 增加了两种异常模式,使操作系统代码可方便地使用数据访问中止异常、指令预取中止异常和未定义指令异常;

  • 增加了MRS/MSR指令,以访问新增的CPSR/SPSR寄存器;

  • 增加了从异常处理返回的指令功能。

ARM版本Ⅳ : V4版架构

V4版架构在V3版上作了进一步扩充,V4版架构是目前应用最广的ARM体系结构,ARM7、ARM8、ARM9和StrongARM都采用该架构。 V4不再强制要求与26位地址空间兼容,而且还明确了哪些指令会引起未定义指令异常。

资料直通车最新Linux内核源码资料文档+视频资料

内核学习地址:Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈

指令集中增加了以下功能:

  • 符号化和非符号化半字及符号化字节的存/取指令;

  • 增加了T变种,处理器可工作在Thumb状态,增加了16位Thumb指令集;

  • 完善了软件中断SWI指令的功能;

  • 处理器系统模式引进特权方式时使用用户寄存器操作;

  • 把一些未使用的指令空间捕获为未定义指令

ARM版本Ⅴ : V5版架构

V5版架构是在V4版基础上增加了一些新的指令,ARM10和Xscale都采用该版架构。

这些新增命令有:

  • 带有链接和交换的转移BLX指令;

  • 计数前导零CLZ指令;

  • BRK中断指令;

  • 增加了数字信号处理指令(V5TE版);

  • 为协处理器增加更多可选择的指令;

  • 改进了ARM/Thumb状态之间的切换效率;

  • E—增强型DSP指令集,包括全部算法操作和16位乘法操作;

  • J----支持新的JAVA,提供字节代码执行的硬件和优化软件加速功能。

ARM版本Ⅵ : V6版架构

V6版架构是2001年发布的,首先在2002年春季发布的ARM11处理器中使用。在降低耗电量地同时,还强化了图形处理性能。通过追加有效进行多媒体处理的SIMD(Single Instruction, Multiple Data,单指令多数据 )功能,将语音及图像的处理功能提高到了原型机的4倍。

此架构在V5版基础上增加了以下功能:

  • THUMBTM:35%代码压缩;

  • DSP扩充:高性能定点DSP功能;

  • JazelleTM:Java性能优化,可提高8倍;

  • Media扩充:音/视频性能优化,可提高4倍

ARM版本ⅤⅡ:V7版架构

V7架构是在ARMv6架构的基础上诞生的。该架构采用了Thumb-2技术,它是在ARM的Thumb代码压缩技术的基础上发展起来的, 并且保持了对现存ARM解决方案的完整的代码兼容性。

Thumb-2技术比纯32位代码少使用31%的内存,减小了系统开销。同时能够提供比已有的基于Thumb技术的解决方案高出38%的性能。

ARMv7架构还采用了NEON技术,将DSP和媒体处理能力提高了近4倍 , 并支持改良的浮点运算, 满足下一代3D图形、游戏物理应用以及传统嵌入式控制应用的需求。此外,ARMv7还支持改良的运行环境,以迎合不断增加的JIT(Just In Time)和DAC(DynamicAdaptive Compilation)技术的使用。

ARM版本ⅤⅢ:V8版架构

这是一个新的IP核,针对高性能的嵌入式信号处理应用而设计的,v8架构是在32位ARM架构上进行开发的,将被首先用于对扩展虚拟地址和64位数据处理技术有更高要求的产品领域,如企业应用、高档消费电子产品。

ARMv8架构包含两个执行状态:AArch64和AArch32。AArch64执行状态针对64位处理技术,引入了一个全新指令集A64;而AArch32执行状态将支持现有的ARM指令集。

目前的ARMv7架构的主要特性都将在ARMv8架构中得以保留或进一步拓展,如:TrustZone技术、虚拟化技术及NEON advanced SIMD技术,等。

其中左侧的就是架构,右侧的是处理器,也可以叫核。arm首个最成功的cpu是ARM7TDMI,是基于ARMv4的。ARM架构包含了下述RISC特性:

  • 读取/储存 架构

  • 不支援地址不对齐内存存取(ARMv6内核现已支援)

  • 正交指令集(任意存取指令可以任意的寻址方式存取数据Orthogonal instruction set)

  • 大量的16 × 32-bit 寄存器阵列(register file)

  • 固定的32 bits 操作码(opcode)长度,降低编码数量所产生的耗费,减轻解码和流水线化的负担。

  • 大多均为一个CPU周期执行。不同版本的架构会有所调整。

和三星相同的其他和arm合作的各大厂商通常会把它的CPU和各类外围IP都放到一起,然后自己拿着图纸去流片,生产出来的也是一个正方形,下面有很多引脚,这个东西不仅包含了CPU,还包含了其他的控制器,这个东西就叫做SOC(system on chip)。从英文来看,所谓的四核SOC什么的,本意就不是单指CPU,而是四核系统。

所以目前各大厂商所做的事情,就是买来ARM的授权,得到ARM处理器的源代码,而后自己搞一些外围IP(或者买或者自己设计),组成一个SOC后,去流片。不同的SOC,架构不同(就是CPU如何和IP联系起来,有的以总线为核心,有的以DDR为核心),所以,海思是拥有自主产权的SOC架构。可是,无论任何厂商,再怎么折腾,都没有怎么动过CPU,ARM核心就好好的呆在那里,那就是中央处理器。

理器

  • ARM Cortex-A :为传统的、基于虚拟存储的操作系统和应用程序而设计,支持 ARM、Thumb 和 Thumb-2 指令集;

  • ARM Cortex-R:针对实时系统设计,支持 ARM、Thumb 和 Thumb-2 指令集;

  • ARM Cortex-M:为对 价格敏感的产品设计,只支持 Thumb-2 指令集。

ARM命名规则

第一个数字:系列名称:eg.ARM7、ARM9

第二个数字:Memory system

2:带有MMU

4:带有MPU

6:无MMU与MPU
12345

第三个数字:Memory size

0:标准Cache(4-128k)

2:减小的Cache

6:可变的Cache
12345

第四个字符:

T:表示支持Thumb指令集

D:表示支持片上调试(Debug)

M:表示内嵌硬件乘法器(Multiplier)

I :支持片上断点和调试点

E:表示支持增强型DSP功能

J :表示支持Jazelle技术,即Java加速器

S:表示全合成式

Guess you like

Origin blog.csdn.net/m0_50662680/article/details/129698954