[Linuxサーバー]ディープラーニングフレームワークMacを実行するための一般的な手順と使用ガイド

1.接続アプリの選択

ウィンドウの下:ビジュアルファイル転送に
winscpを使用し、Macでコマンドライン入力にputtyまたはxshellを使用します:ビジュアルファイル転送にForkLiftを使用し、コマンドライン入力にMac独自の端末使用方法を使用します

2.接続に必要な情報

  • ubuntuなどのサーバーのユーザー名
  • サーバーのアドレスは12.34.56.78です。
  • サーバーのデフォルトのポート番号は、123などの22です。
  • [email protected] -p 123

3.操作手順

3.1指定したフォルダを入力します

  • afileをafileフォルダーにcdafile
  • cd ..現在のフォルダを終了します
  • cd ../.. 2レベルフォルダを終了します
  • ls現在のフォルダ内のすべてのファイル名を表示します

3.2環境の設定

サーバーにanacondaがインストールされている場合、それは非常に簡単です

  • conda creare -n test python = 3.7 Pythonのバージョンが3.7で、名前がtestである環境を作成します
  • conda activatetest環境をアクティブにします
  • condadeactivate環境を閉じます
  • condaenvリストすべての環境を表示
  • conda remove --name test --all delete environment
  • conda install xxx / pip installxxx必要なパッケージをインストールする
    *パッケージが必要なrequirements.txtファイルがプロジェクトに記述されている場合は、conda / pip installrequirements.txtを使用してプロジェクトに必要なすべてのパッケージをインストールすることもできます。
  • conda uninstallxxxパッケージを削除します
  • condalistこの環境のすべてのパッケージを表示

これらのパッケージをtensorflow、pytorch、numpy、cuda、cudnnでインストールする場合は、パッケージの競合を避けるために、公式Webサイトの指示に従ってインストールすることをお勧めします。ここにも紹介があります

3.3トレーニング前の準備

nvidia-smiGPUの使用状況を表示します
。gpuexportCUDA_VISIBLE_DEVICES= 0は、No。0GPUの使用を規定しています(一部のコードはtrain.pyでも指定できます)

3.4トレーニングプロセス

実例:
nohup python -u train.py --config-yml configs / lf_disc_faster_rcnn_x101.yml --load-pthpath checkold / checkpoint_31.pth --validate --gpu-id 0 1 --cpu-workers 8 >> outfile-name &

  • 次の「–」はすべてargsパラメータであり、自分で変更できます
  • nohupは、現在のディレクトリのnohup.outファイルにログを保存することを意味します。*はターミナルに表示されません。
  • python-uはログの印刷を意味します
  • &バックグラウンドで実行されていることを意味するため、リモート接続がオフになり、プログラムは引き続き実行できます
  • tail -fn 50 nohup.outログの最後の50行を表示します(nohup.outが配置されているフォルダーを見つける必要があることに注意してください)

また、主にプログラムの実行時に初期パラメーターを入力する必要がある状況で、画面をバックグラウンドで使用することもできます(nohup組み合わせコマンドが使用されているため、これ以上パラメーターを入力できません)

  • yumインストール画面-yインストール画面
  • screen -S test testという名前のセッションを作成し、このセッションで必要なプログラムを実行します
  • ctrl-ad現在のセッションを終了します
  • screen-lsすべてのセッションを表示
  • screen -rtestテストセッションに再度参加します
  • ctrl-dは現在のセッションを完全に閉じます

3.5トレーニングプログラムを閉じる

  • ctrl-cは、バックグラウンドで実行されていないプログラムを閉じるのに適しています
  • kill -91234ジョブIDが1234のプログラムを閉じます
  • ps aux | greppythonサーバーで現在実行されているすべてのpythonコマンドのジョブIDを表示します

3.6テンソルボードトレーニンググラフを表示する

  • tensorboad --logdir "logs" logsは、トレーニング中に生成されたtensorboadファイルが配置されているフォルダーです。

4.その他の一般的に使用されるコマンド

ctrl-Lは現在のターミナル画面のすべてをクリアします

おすすめ

転載: blog.csdn.net/qq_45347185/article/details/114802256