ARMプラットフォームの性能試験方法を使用

テストディスクアクセス速度:

hdparmのをインストールすることにより、EMMCは、テストのスピードを読み書き:

dolphin@localhost:~$ sudo apt-get install hdparm
dolphin@localhost:/dev$ sudo hdparm -Tt /dev/mmcblk1
/dev/mmcblk1:
 Timing cached reads:   1202 MB in 2.00 seconds = 601.20 MB/sec Timing buffered disk reads: 340 MB in 3.01 seconds = 113.01 MB/sec dolphin@localhost:~/data$ dd count=50 bs=1M if=/dev/zero of=~/data/test.img 50+0 records in 50+0 records out 52428800 bytes (52 MB, 50 MiB) copied, 0.620573 s, 84.5 MB/s 

CPUの性能試験

sysbenchはパフォーマンステストは、CPU /メモリ/スレッド/ IO /データベース上で実行することができ、オープンソースマルチスレッド性能テストツールです。それはすることができますapt install sysbenchインストールされています。
CPUテストは、素数を計算する時に指定を所望の値までの時間(素数を確認するために、この数を2と、この数の平方根との間の合計数で割った値)。

sysbench --num-threads=4 --test=cpu --cpu-max-prime=20000 run

このテストでの結果を見ることができるRK3399は9.9957sです。

Threads started!

CPU speed:
    events per second:  1927.70

General statistics:
    total time:                          10.0027s
    total number of events:              19301

Latency (ms):
         min:                                  1.42 avg: 2.07 max: 22.63 95th percentile: 3.62 sum: 39982.94 Threads fairness: events (avg/stddev): 4825.2500/2066.85 execution time (avg/stddev): 9.9957/0.00 

別の性能試験ランポイントソフトウェアnbenchは、メモリは、整数演算及び浮動小数点演算性能試験単核は、具体的にすることによって、以下の10個の試験項目を含む、とすることができるのwiki参照リンクの詳細については。

  1. 数値ソート - 長い整数の配列をソートします。
  2. 文字列の並べ替えは、 - 任意の長さの文字列の配列をソート。
  3. ビットフィールドは - ビット操作のさまざまな機能を実行します。
  4. 浮動小数点をエミュレート-小さなソフトウェア浮動小数点パッケージ
  5. フーリエ係数 - 波形の一連の近似を算出するための数値解析ルーチン。
  6. 割り当てアルゴリズム - よく知られたタスク割り当てアルゴリズム。
  7. ハフマン圧縮 - よく知られたテキストとグラフィックスの圧縮アルゴリズム。
  8. IDEA暗号化 - 比較的新しいブロック暗号アルゴリズム。
  9. ニューラルネット - 小さいながらも機能的なバックプロパゲーションネットワークシミュレータ。
  10. LU分解 - 線形方程式を解くための堅牢なアルゴリズム。

ソースコードを入手し、コンパイルして実行します。

wget http://www.math.utah.edu/~mayer/linux/nbench-byte-2.2.3.tar.gz
tar -xvzf nbench-byte-2.2.3.tar.gz
cd nbench-byte-2.2.3 make ./nbench 

図6は、79.409 44.893整数および小数点除算を浮動小数実行nbench核RK3399に見ることができます

pi@NanoPi-NEO4:~/nbench-byte-2.2.3$ ./nbench

BYTEmark* Native Mode Benchmark ver. 2 (10/95) Index-split by Andrew D. Balsa (11/97) Linux/Unix* port by Uwe F. Mayer (12/96,11/97) TEST : Iterations/sec. : Old Index : New Index : : Pentium 90* : AMD K6/233* --------------------:------------------:-------------:------------ NUMERIC SORT : 1242.3 : 31.86 : 10.46 STRING SORT : 389.92 : 174.23 : 26.97 BITFIELD : 2.2521e+08 : 38.63 : 8.07 FP EMULATION : 369.93 : 177.51 : 40.96 FOURIER : 23017 : 26.18 : 14.70 ASSIGNMENT : 21.776 : 82.86 : 21.49 IDEA : 6673.9 : 102.07 : 30.31 HUFFMAN : 2230.3 : 61.85 : 19.75 NEURAL NET : 39.53 : 63.50 : 26.71 LU DECOMPOSITION : 1050.7 : 54.43 : 39.31 ==========================ORIGINAL BYTEMARK RESULTS========================== INTEGER INDEX : 79.409 FLOATING-POINT INDEX: 44.893 Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0 ==============================LINUX DATA BELOW=============================== CPU : 6 CPU L2 Cache : OS : Linux 4.4.143 C compiler : gcc version 7.3.0 (Ubuntu/Linaro 7.3.0-27ubuntu1~18.04) libc : static MEMORY INDEX : 16.723 INTEGER INDEX : 22.505 FLOATING-POINT INDEX: 24.899 Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38 * Trademarks are property of their respective holder. 

以下はS5P6818使用32ビットシステムのパフォーマンスです:

pi@NanoPi-Fire3:~/work/nbench-byte-2.2.3$ ./nbench

BYTEmark* Native Mode Benchmark ver. 2 (10/95) Index-split by Andrew D. Balsa (11/97) Linux/Unix* port by Uwe F. Mayer (12/96,11/97) TEST : Iterations/sec. : Old Index : New Index : : Pentium 90* : AMD K6/233* --------------------:------------------:-------------:------------ NUMERIC SORT : 660.92 : 16.95 : 5.57 STRING SORT : 88.288 : 39.45 : 6.11 BITFIELD : 1.9179e+08 : 32.90 : 6.87 FP EMULATION : 102.92 : 49.38 : 11.40 FOURIER : 10112 : 11.50 : 6.46 ASSIGNMENT : 12.921 : 49.17 : 12.75 IDEA : 3181.4 : 48.66 : 14.45 HUFFMAN : 1202.3 : 33.34 : 10.65 NEURAL NET : 13.628 : 21.89 : 9.21 LU DECOMPOSITION : 459.08 : 23.78 : 17.17 ==========================ORIGINAL BYTEMARK RESULTS========================== INTEGER INDEX : 36.521 FLOATING-POINT INDEX: 18.158 Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0 ==============================LINUX DATA BELOW=============================== CPU : 8 CPU L2 Cache : OS : Linux 4.4.49-s5p6818 C compiler : gcc version 5.4.0 20160609 (Ubuntu/Linaro 5.4.0-6ubuntu1~16.04.11) libc : libc-2.23.so MEMORY INDEX : 8.119 INTEGER INDEX : 9.939 FLOATING-POINT INDEX: 10.071 Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38 * Trademarks are property of their respective holder. 

に対応した同じプラットフォームの64ビットシステム上でテスト実行の結果:

BYTEmark* Native Mode Benchmark ver. 2 (10/95)
Index-split by Andrew D. Balsa (11/97) Linux/Unix* port by Uwe F. Mayer (12/96,11/97) TEST : Iterations/sec. : Old Index : New Index : : Pentium 90* : AMD K6/233* --------------------:------------------:-------------:------------ NUMERIC SORT : 800.68 : 20.53 : 6.74 STRING SORT : 159.48 : 71.26 : 11.03 BITFIELD : 2.22e+08 : 38.08 : 7.95 FP EMULATION : 219.6 : 105.37 : 24.32 FOURIER : 11728 : 13.34 : 7.49 ASSIGNMENT : 11.77 : 44.79 : 11.62 IDEA : 3420.5 : 52.32 : 15.53 HUFFMAN : 1133.7 : 31.44 : 10.04 NEURAL NET : 15.737 : 25.28 : 10.63 LU DECOMPOSITION : 532.56 : 27.59 : 19.92 ==========================ORIGINAL BYTEMARK RESULTS========================== INTEGER INDEX : 45.950 FLOATING-POINT INDEX: 21.031 Baseline (MSDOS*) : Pentium* 90, 256 KB L2-cache, Watcom* compiler 10.0 ==============================LINUX DATA BELOW=============================== CPU : 8 CPU L2 Cache : OS : Linux 4.4.49-s5p6818 C compiler : gcc version 7.3.0 (Ubuntu/Linaro 7.3.0-27ubuntu1~18.04) libc : libc-2.27.so MEMORY INDEX : 10.064 INTEGER INDEX : 12.645 FLOATING-POINT INDEX: 11.664 Baseline (LINUX) : AMD K6/233*, 512 KB L2-cache, gcc 2.7.2.3, libc-5.4.38 * Trademarks are property of their respective holder. 

16%増加した以下の試験結果を比較すると、26%の整数増加コンピューティング性能は、浮動小数点:

テスト項目 32ビット 64ビット パフォーマンスが低下
NUMERIC SORT 660.92 800.68 21%
STRINGのSORT 88.288 159.48 81%
BITFIELD 1.92E + 08 2.22E + 08 16%
FPエミュレーション 102.92 219.6 113パーセント
フーリエ 10112 11728 16%
割り当て 12.921 11.77 -9%
アイディア 3181.4 3420.5 8%
ハフマン 1202.3 1133.7 -6%
ニューラルネット 13.628 15.737 15%
LU分解 459.08 532.56 16%
整数 36.521 45.95 26%
浮動小数点 18.158 21.031 16%

DDRパフォーマンステスト

小さなマシンのメモリディスク上に作成し、キャッシュ頻繁にメモリに必要なスピード、小さなファイルの読み書きと持って、もちろん、また、読み取りをテストして、スピードを書き込むために使用することができます。

dolphin@localhost:/$ sudo mkdir /ram
dolphin@localhost:/$ sudo mount -t tmpfs -o size=100m,mode=0777 tmpfs /ram
dolphin@localhost:/$ cd ram dolphin@localhost:/ram$ dd count=80 bs=1M if=/dev/zero of=/ram/test.img 50+0 records in 50+0 records out 52428800 bytes (52 MB, 50 MiB) copied, 0.134943 s, 389 MB/s 

Sysbenchも試験するために使用することができ、例えば、4つのスレッドを指定し、バッファ・サイズは、メモリ10Gにテストデータを送信する、64キロバイトです。

sysbench --threads=4  --memory-block-size=64k --memory-total-size=10G memory run
10240.00 MiB transferred (3538.21 MiB/sec) General statistics: total time: 2.8907s total number of events: 163840 Latency (ms): min: 0.01 avg: 0.07 max: 11.02 95th percentile: 0.10 sum: 11207.68 Threads fairness: events (avg/stddev): 40960.0000/0.00 execution time (avg/stddev): 2.8019/0.02 

私の注意に小型の周りのギフトやジェーン・ブック



著者:shaniadolphin
リンクします。https://www.jianshu.com/p/7a0dc79ced11
出典:ジェーン・ブック
著者によって予約ジェーン帳の著作権は、いかなる形で再現され、承認を得るために、作者に連絡して、ソースを明記してください。

おすすめ

転載: www.cnblogs.com/idyllcheung/p/11282495.html