No momento, há um disco osd danificado no cluster ceph. O disco é feito de RAID 0. Desta vez, mostraremos como executar a recuperação de falha de osd.
Procedimentos operacionais
- Substitua o disco com falha
- Como o disco rígido está executando o RAID 0, você deve refazer o RAID 0 do disco após substituí-lo.
- Remova o disco rígido osd com defeito do cluster ceph.
- Adicione um novo disco rígido osd ao cluster ceph.
1. Substitua o disco com defeito
Neste momento, verifique o status do osd do osd.2 no host ceph01.Após tentar reiniciar o processo osd, ele ainda falha.
2. Como o disco rígido está executando RAID 0, você deve refazer o RAID 0 do disco após substituí-lo.
2.1. Reinicie o host e entre na interface de gerenciamento RAID
Depois de verificar # 4 o status do RAID é FALHA
2.2. Refaça a operação do RAID RAID. Não vou demonstrar aqui como entrar no sistema depois que o RAID voltar ao normal.
Visualize o disco rígido por meio do comando lsblk
3. Remova o disco rígido osd.2 com defeito do cluster ceph.
[root@ceph01 ~]# ceph osd out osd.2
osd.2 is already out.
[root@ceph01 ~]# ceph osd crush rm osd.2
removed item id 2 name 'osd.2' from crush map
[root@ceph01 ~]# ceph auth del osd.2
updated
[root@ceph01 ~]# ceph osd rm osd.2
#验证是否删除成功
[root@ceph01 ~]# ceph osd tree
2. Adicione um novo disco rígido osd ao cluster ceph.
#进入ceph-deploy管理目录中
[root@ceph01 ceph_cluster]# cd /root/ceph_cluster
#添加时注意/dev/sd*位置符
[root@ceph01 ceph_cluster]# ceph-deploy osd create --data /dev/sdd ceph01
#验证是否添加成功