旷视天元MegEngine环境搭建及unet

    旷视科技开源的天元框架,在有pytorch基础的前提下上手很快,中文文档读起来也简单,有自己的社区为用户解决问题。在上面提问解还是很快会得到解决的。 然后华为在四月份也要公测它的全场景MinSpore,有的公司原本有整体架构,想要全都换新的也不是那么简单,各种框架到底哪个会是下一个主流呢。

    天元支持的环境 

我的电脑环境是 Ubuntu 18.04  cuda10.0

目前 MegEngine 安装包集成了使用 GPU 运行代码所需的 CUDA 10.1 环境,不区分 CPU 版本和 GPU 版本。如果您想运行 GPU 程序,请保证机器本身配有 NVIDIA 显卡,并且 驱动 版本高于 418.x 。

由于看到文档中写着CUDA 10.1, 所以我又重装了一下ubuntu的环境,cuda10.0的我没实验好不好使

1.安装显卡驱动

禁用自带显卡驱动
   

sudo gedit /etc/modprobe.d/blacklist.conf 

在打开的文档末尾,加上下面两行代码:

 blacklist nouveau
 options nouveau modeset=0

 更新

sudo update-initramfs -u

 重启电脑reboot,显卡驱动已经禁用所以现在看不到桌面

lsmod | grep nouveau

 检查禁用结果若无输出,则禁用成功

按ctrl+alt+(F1-F6)开始使用命令安装显卡驱动

卸载系统里的Nvidia低版本显卡驱动

sudo apt-get purge nvidia*
sudo add-apt-repository ppa:graphics-drivers
sudo apt-get update

查看Ubuntu推荐的驱动版本:

ubuntu-drivers devices

安装指定版本显卡驱动我安装的430.40

sudo apt-get install nvidia-driver-*** 你的推荐版本

查看安装 

是否成功:nvidia-smi

显示你的显卡情况

watch -n 3 -d nvidia-smi 设置3s刷新显卡使用情况,可以观测训练时显卡使用情况

2.下载cuda10.1

官网:https://developer.nvidia.com/cuda-downloads

下载.run文件 sudo sh 安装 截图中有

除了第一个显卡驱动不安装,剩下的都选

添加环境变量

gedit ~/.bashrc

export PATH="/usr/local/cuda-10.1/bin:$PATH"
export LD_LIBRARY_PATH="/usr/lcoal/cuda-10.1/lib64:$LD_LIBRARY_PATH"

激活环境变量:source ~/.bashrc

cd /usr/local/cuda-10.1/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

result==pass  通过或者输入 nvcc -V C查看cuda版本

3.cudnn安装

官网:https://developer.nvidia.com/rdp/cudnn-archive 

 下载后解压:   

下载完成后,进行解压:
  tar -zxvf cudnn-10.0-linux-x64-v7.6.x.xx.tgz

进入解压文件夹执行

sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64/
sudo cp  cuda/include/cudnn.h /usr/local/cuda-10.1/include/
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h 
sudo chmod a+r /usr/local/cuda-10.1/lib64/libcudnn*

 查看cudnn安装情况

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

结束

等我研究一下github再上传一个unet吧

https://github.com/tangyan-77/MegEngine_unet.git

发布了19 篇原创文章 · 获赞 28 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/TYtangyan/article/details/105231003