ssh远程连服务器(Linux)做实验常见错误

记录一下最近遇到的错误和解决方法,下一次遇到了可以更快的解决~

No space left on device

  • 在训练模型的过程中(需要对模型得权重进行存档),报了No space left on device的错误
    // 可能的原因是:在IO读写的时候,临时占用的内存不够,从而需要引入新的临时文件夹
  • 但是博主认为,可能是最近往服务器里存了太多模型和权重了,在想删文件的时候,cd用tab补全名称时报错
    cd:cannot create temp file for here-document
    // 可能此时系统磁盘几乎用完,可以用df -h查看,然后把一些没用的大文件删掉就好了
// 进入根目录
cd /
// 查看大文件:
sudo du -sh *
// 删除大文件
sudo rm -rf xxx

系统突然卡住

  • Ctrl+Alt+F1可以进入tty1终端
  • 没耐心的我直接reboot了

Error1:BusyBox 开机黑屏

# 查看硬盘命令,列出分区
blkid
# 修复命令fsck  -y  , sdaX 的X 是分区号,列表中能看到
fsck -y /dev/sdaX
# 退出和重启电脑
exit

八成是分区分出错了,有时间我重装一下系统。

Error2:Grub Rescue问题

  • 不要轻易使用fsck,否则会出现难以恢复的数据损失
error : unknow filesystem
grub rescue >

遇到如上问题,按以下方式处理

# 列出所有的分区
ls
#找出系统所在的分区位置
grub rescue >ls	(hd0,msdos2) 
(hd1,msdos2): filesystem is ext2
# 查看这个分区里有没有grub文件夹
grub rescue >ls	(hd0,msdos5)/boot/grub/
或者
grub rescue >ls	(hd0,msdos5)/grub/
重要的是找到i386-pc文件夹
# 将 grub 重新引导到这个位置
grub rescue > set root = (hd0,msdos5)
grub rescue > set prefix = (hd0,msdos5)/boot/grub # 有些时候是 (hd0,msdos5)/grub
grub rescue > insmod normal 
grub rescue > normal

进入系统后,利用终端修复grub 引导

$ sudo update-grub
$ sudo grub-install /dev/sda

一定不要忘记利用终端修复grub引导,发现分辨率的问题也迎刃而解了。

Tips1:连接校园网

把网线接上

sudo pppoeconf

Tips2:ssh

最近一直在挣扎和ssh有关的,还有linux系统

连了半天都没连上,但是究其原因,还是没有和服务器在同一个局域网下!!!

同一个局域网!
同一个局域网!
同一个局域网!
重要的事情说三遍。

ubuntu没有ipv4地址

sudo dhclient enp0s3 //网卡名

dhclient可以用于获取ip。

Refenrences

  1. BusyBox v1.22.1 (Ubuntu 1:1.22.0-15ubuntu1) built-in shell (ash) 开机黑屏
    https://blog.csdn.net/wto882dim/article/details/84594362
  2. [Linux]记录一次grub rescure的过程
    https://blog.csdn.net/wangyijieonline/article/details/103401545

Guess you like

Origin blog.csdn.net/weixin_44145782/article/details/115049831