- 报错1:
- 报错:torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 23.69 GiB total capacity; 21.59 GiB already allocated; 20.31 MiB free; 22.15 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
- 原因:内存不够了
- 解决:改小batch_size
- 报错2:
- 报错:E: Package ' *** ' has no installation candidate
- 解决:依次运行:apt-get update,apt-get upgrade(过程十分漫长),然后再重新执行安装指令
- 报错3:
- 报错:安装kaldi报错:Intel MKL does not seem to be installed.
- 解决:参考:https://blog.csdn.net/Noooo0ob/article/details/122936006
- 进入tools目录,执行:extras/install_mkl.sh (时间较长)
- 再运行extras/check_dependencies.sh,就可以看到已经安装好了
- 报错4:
- 报错:执行apt-get upgrade报错:Errors were encountered while processing: /tmp/apt-dpkg-install-FdgT0V/08-tzdata_2022f-0ubuntu0.20.
- 解决:
cd /var/lib/dpkg mv info info.bak mkdir info apt-get upgrade
- 报错5:
- 报错:Collecting torch Killed
- 解决:在pip指令后加上 --no-cache-dir
- 报错6:
- 报错:Unable to locate package
- 解决:apt-get update
- 深度学习环境请一定去官网下安装包,不要直接搜“Ubuntu18.04 CUDA11.3 安装pytorch”之类的,你搜到的真的不一定和你的环境是一样的。用官网安装能解决深度学习框架安装的90%问题
- 下载tensorflow不同whl的网址:https://pypi.tuna.tsinghua.edu.cn/simple/tensorflow/
- https://www.lfd.uci.edu/~gohlke/pythonlibs/ 可以查看安装的包对应的python版本cp38表示对应3.8版本
- wsl 安装docker:
- curl https://get.docker.com | sh
- 然后再启动:sudo service docker start
- 如果需要编译安装的github源码一直因为格式安装不了:
- 分析原因:可能是因为是从windows上下载然后再迁移到linux的原因)
- 解决:直接在虚机中git clone 不要经过windows转移
- csv文件:
- 逗号分隔值
- 保存形式:其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。
- 分割符号:CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。
-
num_batches_tracked
-
BatchNorm, 批规范化,主要用于解决协方差偏移问题,主要分三部分:
-
计算batch均值和方差
-
规范化
-
仿射affine
-
- 均值和方差是batch的统计特性,pytorch中用running_mean和running_var表示
- \gamma和\beta是可学习的参数,分别是affine中的weight和bias
- track_running_stats: 决定是否跟踪整个训练过程中的batch的统计特性,而不仅仅是当前batch的特性。
- num_batches_tracked:如果设置track_running_stats为真,这个就会起作用,代表跟踪的batch个数,即统计了多少个batch的特性。
-
- 删除文件时遇到“你需要来自administrator的权限才能对此文件夹进行更改”, 重启之后就可以了
- 从github上仅下载单个文件,点击要下载的文件进入,点击raw右键,从链接另存文件为。
- .torrent格式的文件是种子,使用迅雷打开就可以下载对应的文件
- 将git clone的仓库变成普通的文件夹:删除.git 文件夹,以及.gitignore文件即可
- 注意安装svn:apt-get install subversion,安装awk:apt-get install gawk
- docker创建可使用gpu的容器:
- docker run --gpus all --name test -d -t ubuntu:18.04 (这个是正确的指令!!!):docker run --gpus all --name 容器名 -d -t 镜像名:tag
- 所有显卡都对容器可见:docker run --gpus all --name 容器名 -d -t 镜像id
- 只有显卡1对容器可见:docker run --gpus="1" --name 容器名 -d -t 镜像id
- 编程知识
-
enumerate 最终返回的是已经封装好的一个迭代器
-
pytorch中查看tensor数据array格式的方法:
-
法一:.data.detach().cpu().numpy()
-
法二:tensor.size()
-
-
[:,None]: None表示新增一个维度,并且上方的代码表示在第二维新增一个维度,例如果原始维度为(5,5),则操作之后的维度为(5,1,5),即None放在哪一维,哪一维上就出现新的维度
-
list中使用三个点:表示省略所有的冒号,用省略号来代替
扫描二维码关注公众号,回复: 14558131 查看本文章 -
只获取tensor中的值:
-
x.cpu().numpy() (对于tensor没有在模型中的情况)
-
放置到cuda上并且已经在模型中的情况:x.cpu().detach().numpy()
-
-
22年12月log整理剩余
猜你喜欢
转载自blog.csdn.net/weixin_45647721/article/details/128756531
今日推荐
周排行