1.アダムは0.00035香の真率を学びました。
2. SGD +運動量の学習率はアダムより通常はるかに大きい、適当な間隔を、見つける必要があります。
3.早期終了、オーバーフィットを防止します。
4.アンサンブルが大幅に両方のモデルのために、より良い結果を得ることができます右の重量モデルのより良い性能を向上させるために、適切な、モデルのパフォーマンスを向上させることができます。
1.アダムは0.00035香の真率を学びました。
2. SGD +運動量の学習率はアダムより通常はるかに大きい、適当な間隔を、見つける必要があります。
3.早期終了、オーバーフィットを防止します。
4.アンサンブルが大幅に両方のモデルのために、より良い結果を得ることができます右の重量モデルのより良い性能を向上させるために、適切な、モデルのパフォーマンスを向上させることができます。