1、查看该服务器上内存使用情况
df -h
查看服务器上各个GPU占用情况
nvidia-smi
查看服务器系统版本号
cat /etc/redhat-release
2、查看自己在服务器上占用内存
du -lsh ./
3、指定GPU跑程序
CUDA_VISIBLE_DEVICES=gpuID python xxx.py
4、安装指定版本tensorflow(gpu版)
pip install tensorflow-gpu==版本
卸载tensorflow
pip uninstall tensorflow-gpu
5、查看服务器上已经安装的tensorflow版本
python
import tensorflow as tf
tf._version_
6、查看安装的cudnn版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A2
7、查看安装的cuda版本
nvcc --version
8、当前位置解压zip文件
unzip XXX.zip
9、从远程服务器mnt目录下拷贝文件到本地
scp -r [email protected]:/mnt/data-3/data/yu01.wang/goods_data/forKL /Users/Cheney/Desktop/datasp
scp -r 远程服务器用户名@远程服务器ip:需要拷贝文件目录 本地存放地址
10、查看系统中各个进程的资源占用状况
top
htop
11、查看当前工作目录的完整路径
pwd
12、拷贝文件
cp -r /home/users/gpuwork/submit_multi_hosts_tutorial/ /home/users/le.kang
cp -r file dir # r 递归拷贝
13、ls命令
ls # 查看文件夹
ls -l # 查看文件夹详细信息
ll # 同ls -l
14、修改生效,更新.bashrc
source ~.bashrc
15、查询系统所有作业信息
qstat -a
16、将HDFS目录下的文件下载到本地
hdfs dfs -get hdfs://hobot-bigdata/public_code/sample_tensorfolw_job.tar.gz
17、查找 libpython3.6m.so.1.0 的位置
locate libpython3.6m.so.1.0
18、查看scp记录
history | grep scp
19、设置为每 10s 显示一次显存情况:
$ watch -n 10 nvidia-smi
20、移动文件mv命令
cd 所在目录
mv 文件名 目标路径
mv /usr/lib/* /zone # 是将 /usr/lib/下所有的东西移到/zone/中
mv /usr/lib/*.txt /zone # 是将lib下以txt结尾的所有文件移到/zone中
21、mac 管理多个终端窗口命令
# 打开一个窗口
command + N
#在一个新窗口中建立多个终端窗口
command + T