Arquitetura do sistema Ceph e conceitos básicos

Arquitetura e conceitos básicos do sistema Ceph O
Ceph é um sistema de armazenamento distribuído e unificado, projetado para excelente desempenho, confiabilidade e escalabilidade.

"Unificado" significa que um sistema de armazenamento Ceph pode fornecer três funções de armazenamento de objetos, armazenamento em bloco e armazenamento em sistema de arquivos ao mesmo tempo, a fim de simplificar a implantação, operação e manutenção, com a premissa de atender a diferentes necessidades de aplicativos.

"Distribuído" significa que o sistema Ceph é realmente descentralizado e não tem limite superior teórico de escalabilidade da escala do sistema.Na prática, o Ceph pode ser implantado em milhares de servidores.


Autor: Menor Liu,

Este trabalho está licenciado sob o Contrato de Licença de Versão Não Localizada Creative Commons Atribuição-Uso Não-Comercial 3.0 da mesma maneira.

O link para este artigo é: http://blog.csdn.net/younger_china/article/details/76794987


Arquitetura
do sistema A arquitetura do sistema da Ceph consiste em três níveis: a parte mais baixa e principal é o sistema de armazenamento de objetos RADOS; a segunda camada é a camada da biblioteca librados; a camada superior corresponde às diferentes formas de implementação da interface de armazenamento da Ceph.

A camada inferior é baseada no RADOS (armazenamento de objetos confiável, autônomo e distribuído), que inclui o processo de serviço em segundo plano ceph-osd e o processo de monitoramento ceph-mon.

A biblioteca librados da camada intermediária é usada para acessar o sistema de armazenamento de objetos RADOS local ou remotamente através da rede.

A camada superior fornece três interfaces de armazenamento diferentes para aplicativos: interface de armazenamento em bloco, interface de armazenamento de objetos e interface do sistema de arquivos. O servidor de metadados MDS do sistema de arquivos é usado para fornecer acesso aos metadados. Os dados são acessados ​​diretamente através da biblioteca librados.

Existem dois conceitos de objetos no sistema ceph: um é o armazenamento de objetos no RGW e o outro é o objeto armazenado no back-end do Ceph (a seguir denominado objeto Rados) .Os dois precisam ser distinguidos: o primeiro é orientado ao usuário e o usuário O objeto que a interface pode acessar, o último é o objeto operado pelo servidor ceph;

Rados O
RADOS é composto principalmente por dois tipos de nós: um é um grande número de OSD (Object Storage Device) responsável por concluir as funções de armazenamento e manutenção de dados e o outro são vários monitores responsáveis ​​por concluir a detecção e manutenção do estado do sistema.

monitor

O Monitor é um processo daemon implementado independentemente. Ao formar um cluster Monitor para garantir sua alta disponibilidade. O cluster Monitor atinge a consistência de seus próprios dados através do algoritmo Paxos. Ele fornece informações de configuração global, como informações de nó, para todo o sistema de armazenamento.
OSD


 O OSD é um processo daemon responsável pelo armazenamento físico, cuja função é armazenar dados, manipular replicação, recuperação, preenchimento e rebalanceamento de dados e fornecer algumas informações de monitoramento aos Ceph Monitors, verificando a pulsação de outros daemons OSD. Quando o cluster de armazenamento Ceph está configurado para ter 2 cópias, pelo menos 2 daemons OSD são necessários para que o cluster atinja o estado ativo + limpo.

Conceitos básicos
Existem vários conceitos básicos no cluster Ceph: objeto rados, OSD, PG, PGP, pool, arquivo, rbd, objeto rgw, etc. Esses conceitos básicos formam a arquitetura lógica de todo o cluster Ceph.

Objeto Rados

O objeto é a unidade básica de armazenamento de dados, geralmente o tamanho padrão de 4 MB.
Um objeto consiste em três partes:
(1) ID do objeto (ID): identifica exclusivamente um objeto.
(2) Dados do objeto: corresponde a um arquivo no sistema de arquivos local e os dados do objeto são salvos no arquivo.
(3) Metadados do objeto: na forma de Valor-chave (par de valor-chave), ele pode ser salvo nos atributos estendidos correspondentes ao arquivo.
OSD (dispositivo de armazenamento de objeto)


O OSD é um processo responsável pelo armazenamento físico, geralmente configurado para corresponder a um disco, um por um, e um disco inicia um processo OSD. (Para funções detalhadas, consulte a introdução anterior)
Descrição do relacionamento:
(1) Vários PGs podem ser distribuídos em um OSD
(2) O dispositivo OSD é um
PG portador (grupo de posicionamento) que armazena objetos rados

PG é uma camada de lógica acima do OSD, que pode ser considerada como um conceito lógico. Pode ser entendido pelo nome que PG é um grupo de estratégias de posicionamento, que é uma coleção de objetos.Todos os objetos na coleção têm a mesma estratégia de posicionamento: cópias dos objetos são distribuídas na mesma lista OSD.
Descrição do relacionamento:
(1) PG possui mestre e escravo.Para várias cópias, as cópias mestre e escravo de um PG são distribuídas em diferentes OSDs;
(2) Um objeto pode pertencer apenas a um PG e um PG contém muitos objetos
( 3) um OSD PG correspondente a uma lista de todos os objetos armazenados na PG para o OSD correspondente na lista do objeto aqui é rados objeto, em vez do objeto usuário piscina


Pool é um pool de armazenamento abstrato, que é uma camada de lógica sobre o PG, que
especifica o tipo de redundância de dados e a estratégia de distribuição de cópias correspondente. Atualmente, dois tipos de conjuntos são implementados: tipo replicado e tipo de código de eliminação.
Descrição do relacionamento:
(1) Um pool é composto por vários PGs, e um PG só pode pertencer a um POOL
(2) PGs no mesmo Pool têm o mesmo tipo, por exemplo, se Pool é um tipo de cópia, todos os PGs no Pool
PGP (Grupo de colocação de placares) com várias cópias

Não há muitas apresentações sobre o PGP, "Learning Ceph":


PGP é o grupo de canais para fins de canal, que deve ser mantido igual ao número total de grupos de canais (pg_num). Para um conjunto Ceph, se você aumentar o número de grupos de canais, ou seja, pg_num, também deverá aumentar pgp_num para o mesmo valor inteiro que pg_num para que o cluster possa iniciar o reequilíbrio. O mecanismo de rebalanceamento secreto pode ser entendido da seguinte maneira. O valor pg_num define o número de grupos de veiculações, que são mapeados para OSDs. Quando pg_num é aumentado para qualquer pool, cada PG desse pool é dividido pela metade, mas todos permanecem mapeados para o OSD pai. Até esse momento, o Ceph não inicia o reequilíbrio. Agora, quando você aumenta o valor pgp_num para o mesmo pool, os PGs começam a migrar do pai para outro OSD e o reequilíbrio do cluster é iniciado. Nesse caminho,
O significado básico é:


1. jogo PGP oposto a acção normalizadora PG;
mesmos valores 2. PGP deve PG, PG é aumentada no valor, enquanto o aumento do valor de PGP também para manter o mesmo valor ambos;
3. quando um grupo de PG aumenta, Ceph e não começar reequilíbrio, só depois de aumentar o valor da PGP, PG vai começar a migrar para o outro OSD, e começou reequilíbrio
Arquivo

O arquivo é um conceito no sistema de arquivos; o
sistema de arquivos ceph é um sistema lógico construído com base no conjunto de armazenamentos de metadados e no conjunto de armazenamentos de dados.Os arquivos no sistema de arquivos são mapeados para objetos (objetos rados) por meio de libcephfs e RADOS, e depois usam o cálculo de esmagamento para localizar A localização no dispositivo de armazenamento.
RBD (dispositivo de bloco Rados)

O RBD é um dispositivo de bloco ceph; a
imagem RBD é um sistema de armazenamento lógico construído em um pool de armazenamento.A imagem RBD é mapeada para um objeto (objeto rados) através do librbd e RADOS e, em seguida, usa o cálculo de esmagamento para localizar o local no dispositivo de armazenamento.
Objeto Rgw

Objeto Rgw, geralmente refere-se a um documento, imagem ou arquivo de vídeo, etc. Embora os usuários possam fazer upload diretamente de um diretório, o ceph não salva o Objeto Rgw de acordo com a hierarquia de diretórios, todos os Objetos Rgw são planos e Objetos Rgw são
mapeados por librados e RADOS. O objeto (objeto rados) e use o cálculo de esmagamento para localizar o local no dispositivo de armazenamento.
O conceito básico é introduzido aqui ~~~

Autor: Menor Liu,

Este trabalho está licenciado sob o Contrato de Licença de Versão Não Localizada Creative Commons Atribuição-Uso Não-Comercial 3.0 da mesma maneira.

O link para este artigo é: http://blog.csdn.net/younger_china/article/details/76794987


————————————————
Declaração de direitos autorais: este artigo é um artigo original do blogger da CSDN "YoungerChina", seguindo o contrato de direitos autorais do CC 4.0 BY-SA, por favor, anexe o link da fonte original e esta declaração para reimpressão .
Link original: https://blog.csdn.net/younger_china/article/details/76794987

Publicado 13 artigos originais · Curtidas6 · Visitantes 10.000+

Acho que você gosta

Origin blog.csdn.net/majianting/article/details/103024816
Recomendado
Clasificación