Transfomrer Benchmark3090 vs. 3090Ti (Li Mu から学ぶ AI の宿題の簡易版)

Li Mu 氏がデュアルカード 3090Ti をディープ ラーニング マシンとしてインストールするビデオを見て、私はデュアルカード 3090 マシンをディープ ラーニング ホストとしてインストールすることにしました。この記事では主に3090と3090Tiの性能比較テストを行い、李牧氏の実機とどれだけ離れているかを比較していきます。
環境:
Ubuntu20.04
AMD5800 8core 16Thread
RTX3090
Pytorch1.13(gpu)
Python3.9

1.micro_benchのパフォーマンス表示

ムーシェンのソースコード
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください

画像の説明を追加してください
画像の説明を追加してください

2.トランスフォーマー性能表示

Mushen のソースコード
現在のマシンには 3090 カードが 1 枚しか搭載されていないため、MultiGPU テストは後で補足します。
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
画像の説明を追加してください
概要: 単精度と 3090TI の間には若干の差 (10 ~ 15%) があり、半精度の間にはほとんど差がありません。

おすすめ

転載: blog.csdn.net/m0_46339652/article/details/129468748