1.環境
ubuntu20.04
docker
nvidia-docker
2.問題
複数のプロセスを開始すると、他のプロセスが一緒に強制終了されて強制終了されます。
この現象はブログhttps://blog.csdn.net/Tilyp/article/details/103367159に似ていますが、解決策は見られません。10時間かかる場合があります(マルチプレイヤーパワー)。
3.分析
1)2つのプロセスを別々に開始する場合は、点滅を続けて、メモリが使い果たされているかどうか、または空きメモリがあるかどうかを確認します。
cat /proc/meminfo | grep Mem
2)プロセスによって占有されているメモリを分析します。
最初にnvidia-smiを使用してプロセスpidを表示します。
nvidia-smi
次に、次のコマンドを使用して、プロセスのメモリ使用量を表示します。
ps -aux | grep your_pid
または、前のプロセスのメモリ使用量を確認します。
ps aux | sort -k4nr | head -10
3)メモリ制限の問題について、以前に見た記事を考えてみてください。Dockerリソース制限リファレンス:
https://www.icode9.com/content-4-827661.html
4.解決する
-mパラメーターをより大きな値に設定します。問題を解決しました。8GBから16GBまたは32GBに設定します。これはローカル最大メモリに関連していて面倒なので、直接最大に設定してください。
nvidia-docker run -p 10001:22 -m 32GB ...
5.質問を残す
同じ構成を使用している他の機器ではエラーは発生しませんが、新しいマシンでは問題は依然として不明です。
それはシステムまたは更新されたDockerでしょうか???