1. Adão aprendeu a verdadeira taxa de 0,00035 incenso;
2. SGD taxa de aprendizagem + Momentum deve encontrar um intervalo adequado, geralmente muito maior do que Adam;
3. A terminação precoce, para evitar o excesso de montagem;
4. Ensemble pode melhorar significativamente o desempenho do modelo, para ambos os modelos, adequados para aumentar as melhor desempenho dos modelos de peso certo pode obter melhores resultados;