Ein kurzer Überblick über CPU-Leistungsindikatoren

Als Rechenkern und Steuerkern eines Computers besteht die CPU (Central Processing Unit) aus einer Recheneinheit, einem Controller, einem Register und einem Bus, der die Daten, die Steuerung und den Status der Verbindung zwischen ihnen realisiert bestimmt die Stärke der Rechenleistung des Computers. Als zentrale Grundkomponente der Informationstechnologiebranche kann der Betrieb der CPU in vier Phasen unterteilt werden: Abrufen (Fetch), Dekodieren (Decode), Ausführen (Execute) und Zurückschreiben (Writeback).

Fassen Sie das Funktionsprinzip der CPU in einem Satz zusammen: Die CPU ruft Anweisungen aus dem Speicher oder Cache-Speicher ab, legt die Anweisungen in den Registern ab, dekodiert die Anweisungen und führt die Anweisungen aus.

In der eingebetteten Systemindustrie umfassen die zur Bewertung von CPU-Leistungsindikatoren verwendeten Standards hauptsächlich:

  • MIPS (Millionen Anweisungen pro Sekunde) : Dies ist die Anzahl der Maschinensprachenanweisungen auf Millionenebene, die pro Sekunde ausgeführt werden können. Sie wird zur Berechnung der Verarbeitungsleistung der zweiten Ebene des Systems verwendet und ist ein Indikator zur Messung der CPU-Geschwindigkeit .

  • DMIPS (Dhrystone MIPS) : bezieht sich auf die relative Leistung der CPU bei der Ausführung von Ganzzahloperationen (Dhrystone) und gilt nur für die Auswertung von Skalarmaschinen (entsprechend: Vektormaschinen).

  • FLOPS (Gleitkommaoperationen pro Sekunde) : Gibt die Anzahl der von der CPU pro Sekunde ausgeführten Gleitkommaoperationen an und wird hauptsächlich zur Messung der Gleitkomma-Rechenleistung des Computers verwendet.

  • CoreMark: Als Leistungsbewertung wird die Anzahl der Iterationen pro Sekunde herangezogen.

MIPS-Standard

In den 1970er Jahren wurde die Leistung von Minicomputern im Vergleich zum VAX MIPS bewertet, wobei man sich auf die Laufzeit beim Ausführen desselben Jobs im Vergleich zum VAX 11/780 (einem am Markt anerkannten 1-MIPS-Gerät) bezog.

▲ Der 46-jährige VAX 11/780

MIPS kann nicht unter verschiedenen Prozessorarchitekturen verglichen werden. Da nicht jeder mechanische Befehl in einem einzigen Zyklus berechnet werden kann, wird bei der Berechnung von MIPS ein CPI-Wert (Clock Cycle Per Instruction, die durchschnittliche Anzahl von Taktzyklen pro Befehl) eingeführt. Die Formel lautet wie folgt:

  • MIPS=Anzahl der Anweisungen/(Ausführungszeit*1000000)

  • MIPS=Hauptfrequenz/(CPI*1000000)

DMIPS-Standard

In gewissem Sinne verwendet DMIPS auch den VAX 11/780-Prozessor als Nominalwert.

Hier müssen wir zunächst einen der repräsentativsten Allzweck-Lauf-Score-Prozessoren vorstellen: Dhrystone. Dhrystone ist ein Benchmark-Testprogramm, das 1984 von Reinhold P. Weicker vorgeschlagen wurde. Sein Hauptzweck besteht darin, die Leistung von Prozessor-Ganzzahloperationen und Logikoperationen zu testen. Da der VAX 11/780-Prozessor das Dhrystone-Programm 1757 Mal pro Sekunde durchlaufen kann, ist die Anzahl der Zyklen, die andere Prozessoren das Dhrystone-Programm pro Sekunde ausführen, geteilt durch 1757, sein DMIPS-Wert.

Auf dieser Grundlage kann durch Entfernen möglicher Einflussfaktoren wie Prozess- und Stromverbrauch und Teilen des DMIPS-Werts des Prozessors durch seine Frequenz der DMIPS/MHz-Wert ermittelt werden, der die Leistung des Prozessor-Mikroarchitekturdesigns selbst intuitiver widerspiegeln kann.

Der Unterschied zwischen MIPS und DMIPS:

  • Die von MIPS reflektierte Fähigkeit – die Anzahl der Befehlssätze, die pro Sekunde ausgeführt werden können; diese Fähigkeit wird durch Hardwareeigenschaften wie CPU-Architektur und Speicherzugriffsgeschwindigkeit bestimmt;

  • Die von DMIPS reflektierte Kapazität – die Anzahl der Jobs, die pro Sekunde erreicht werden können.

*Entsprechend der wörtlichen Bedeutung scheint es eine Umrechnungsformel zwischen MIPS und DMIPS zu geben, aber nach der Überprüfung bewerten die beiden die CPU-Leistung aus unterschiedlichen Blickwinkeln und es besteht keine direkte Umrechnungsbeziehung.

*Der Name „Dhrystone“ stammt ursprünglich von „Wetstone“, einem anderen Tool zum Testen der CPU-Gleitkomma-Rechenleistung, das relativ früher erschien. „Wetstone“ bedeutet ursprünglich „nasser Stein“, und Dhrystone ist ein trockener Stein, der zum Testen der ganzzahligen Rechenleistung der CPU verwendet wird.

FLOPS-Standard

FLOPS werden häufig zur Schätzung der Ausführungsleistung von Computern verwendet, insbesondere im Bereich des wissenschaftlichen Rechnens, das eine große Anzahl von Gleitkommaoperationen verwendet. „Gleitkommaoperationen“ benötigen mehr Zeit als Ganzzahloperationen, da sie alle Operationen mit Dezimalzahlen abdecken. Die meisten aktuellen Prozessoren sind mit einer „Float Point Unit“ (Float Point Unit, FPU) ausgestattet, die speziell für die Verarbeitung von Gleitkommaoperationen bestimmt ist. Der FLOPS-Standard misst also tatsächlich die FPU-Ausführungsgeschwindigkeit.

CoreMark-Standard

CoreMark kann als umfassendes Prozessor-Running-Score-Programm ähnlich Dhrystone verstanden werden und wurde 2009 von Shay Gla-On von der gemeinnützigen Organisation Embedded Microprocessor Benchmark Association EEMBC vorgeschlagen. Sein Hauptziel besteht darin, die Kernleistung des Prozessors zu testen.

*EEMBC: Benchmark-Konsortium für eingebettete Mikroprozessoren

Das CoreMark-Programm ist in der Sprache C geschrieben und umfasst die folgenden Algorithmen: Aufzählung (Suchen und Sortieren), mathematische Matrixoperation (gemeinsame Matrixoperation), Zustandsmaschine (zur Bestimmung, ob der Eingabestrom gültige Zahlen enthält) und CRC (zyklische Redundanzprüfung). , zyklische Redundanzprüfung). CoreMark verfügt über spezielle Ausführungs- und Berichtsregeln, die einen schwierigen Vergleich von Testergebnissen aufgrund unterschiedlicher verwendeter kompilierter Bibliotheken vermeiden können. Daher gilt der CoreMark-Standard als praktischer als der Dhrystone-Standard.

Der CoreMark-Standard verwendet als Messstandard die Anzahl der Ausführungen des CoreMark-Programms pro Zeiteinheit unter einer bestimmten Konfigurationsparameterkombination, und die Indexeinheit ist CoreMark/MHz. Eine höhere CoreMark-Zahl bedeutet eine höhere Leistung.

▲ Offizieller Leistungsvergleich des ARM-Prozessors: Cortex-M-Teileserie

Verweise

[1] Gu Mengjie. Entwurf eines allgemeinen Mikrocontrollers basierend auf der RISC-V-Befehlssatzarchitektur [D]. Donghua University, 2022. DOI: 10.27012/d.cnki.gdhuu.2022.000609.

[2] Betrachten Sie die Unterschiede zwischen ARM Cortex-M-Prozessoren aus der Perspektive der Leistungsindikatoren, https://mp.weixin.qq.com/s/o1amLyzc8ZO8l59N5F2vyw

[3] Beschreibung der Leistungsbewertungseinheit, https://zhuanlan.zhihu.com/p/571545878

[4] Populärwissenschaftliche Zusammenfassung: Flops, FLOPS, GFLOPS, https://imgtec.eetrend.com/blog/2020/100048896.html

[5]Klassische Benchmarks, http://www.roylongbottom.org.uk/classic.htm

Supongo que te gusta

Origin blog.csdn.net/digi2020/article/details/131704648
Recomendado
Clasificación