Como usar a ferramenta de teste de desempenho de armazenamento SmartX OWL para otimizar o gerenciamento de desempenho?

Autor: Zhang Ruisong, da equipe financeira SmartX, que está profundamente envolvido no setor

Quando o pessoal de operação e manutenção gerencia clusters diariamente, às vezes inevitavelmente se deparam com as seguintes confusões:

  • Um novo negócio está pronto para ficar online. Como escolher o ambiente de armazenamento para hospedar o negócio quando vários conjuntos de armazenamento estão disponíveis?

  • A máquina virtual de negócios funciona muito rápido quando é lançada pela primeira vez, mas depois de um período de execução, por que o software e o hardware ainda funcionam lentamente, mesmo que não haja problemas óbvios?

  • O feedback comercial indica que o desempenho da máquina virtual às vezes é bom ou ruim. O que está acontecendo?

  • O armazenamento recém-lançado é diferente da configuração original.Como avaliar a diferença de desempenho entre os dois e que tipo de negócio eles são adequados para administrar?

Todos esses cenários envolvem monitoramento de desempenho de armazenamento e também testam a capacidade do pessoal de operação e manutenção de usar dados de monitoramento para organizar razoavelmente a colocação de negócios e otimizar o desempenho.

Para ajudar os usuários a gerenciar melhor o desempenho do armazenamento em cluster, a SmartX desenvolveu de forma independente a ferramenta automatizada de teste de desempenho de armazenamento OWL. Neste artigo, apresentaremos os recursos funcionais e o uso do OWL e mostraremos como usar os resultados dos testes OWL para otimizar o gerenciamento de desempenho e evitar gargalos de desempenho por meio de aplicações práticas.

Introdução às ferramentas OWL

OWL é uma plataforma web automatizada de teste de desempenho de armazenamento desenvolvida pela SmartX. Ela usa fio como uma ferramenta de aquisição de desempenho para realizar testes de estresse de desempenho de cluster. Como o fio pode ser ajustado para cenários de teste de modelo com múltiplas filas, largura de banda e múltiplas E/S, ele pode simular a maioria das E/S de negócios (por exemplo, fio é frequentemente usado para testes de desempenho e ajuste do MySQL), então tornou-se o software mais popular que suporta OWL. Melhor escolha. Além disso, o OWL não está vinculado a clusters hiperconvergentes SmartX e os usuários também podem usar o OWL em outros ambientes para testes de desempenho .

OWL pode ajudar os usuários nas três áreas a seguir:

Adapte-se a diferentes configurações de hardware e forneça a cada conjunto de armazenamento sua própria "linha de base" de desempenho de armazenamento

Para atender às necessidades de transformação da infraestrutura de TI de Xinchhuang, os usuários podem adquirir acessórios domésticos com os quais nunca tiveram contato antes. Com uma combinação de vários acessórios, os engenheiros precisam entender quanto desempenho essas novas configurações de armazenamento podem alcançar e quais aplicativos e bancos de dados elas suportam. O método de verificação tradicional é usar diretamente a nova arquitetura para testar a execução de uma máquina virtual de negócios, enquanto o uso de OWL pode simular um modelo de E/S semelhante para verificar o desempenho do cluster, testando assim a linha de base de desempenho desse armazenamento de cluster.

Consulte a linha de base de desempenho de armazenamento e inicie máquinas virtuais de serviço por categoria

Os usuários podem selecionar clusters de armazenamento apropriados para máquinas virtuais empresariais que precisam estar on-line com base na linha de base de desempenho de armazenamento fornecida pelo OWL . Por exemplo, para serviços de banco de dados com grandes IOPS, os usuários podem usar clusters totalmente flash. Para empresas com IOPS relativamente leves e menos interação de dados, os usuários podem usar clusters flash híbridos com desempenho de custo mais alto.

Além disso, além de permitir que os usuários saibam antecipadamente o máximo de E/S que cada host pode transportar, o OWL também pode construir um ambiente de simulação para ajudar os usuários a entender o tamanho de E/S que eles podem precisar antes que o negócio fique online, e razoavelmente alocar o posicionamento da máquina virtual para evitar Colocar várias máquinas virtuais que ocupam uma grande largura de banda em um host fará com que a largura de banda seja "perseguida pela empresa" após o lançamento oficial da empresa.

Combinado com a função de alarme, alerta proativamente sobre riscos de gargalos de desempenho

Depois de usar o OWL para obter a linha de base do teste de desempenho, os usuários podem definir o limite de largura de banda de leitura e gravação correspondente ao desempenho do armazenamento nas regras de alarme de cada cluster. Quando a largura de banda da máquina virtual atingir 70% e 80% da largura de banda principal, o engenheiro de operação e manutenção receberá avisos de alarme respectivamente, para observar o uso da largura de banda da máquina virtual e de outros hosts em tempo hábil. Dessa forma, os usuários podem migrar esta máquina virtual para um host ou cluster relativamente ocioso antes do lançamento do novo negócio.

Método de uso OWL e processo de teste

Preparação antes do teste

Como a ferramenta OWL opera como uma máquina virtual, o usuário precisa importar ovf, configurar o endereço IP para OWL e garantir a comunicação ssh entre o OWL e a VM de teste. Os requisitos de configuração da VM de teste são os seguintes:

  • Linux 2c 4G 40G+50G

  • Configure o endereço IP e comunique-se com a ferramenta OWL ssh

  • Instale o software FIO

Processo de teste

  1. Faça login na interface da web OWL.

  2. Crie um modelo de teste.

  3. Adicione objetos de teste.

  4. Crie tarefas de teste.

  5. Inicie a tarefa de teste.

  6. O OWL combina a função de alarme para alertar proativamente sobre riscos de gargalos de desempenho.

Para obter um processo de teste detalhado, consulte a seguinte demonstração: Introdução ao monitoramento de desempenho de armazenamento em cluster, gerenciamento e ferramentas de teste automatizado .

Use resultados de testes para otimizar o gerenciamento de desempenho de armazenamento

Modelos de teste comuns

A seguir está o modelo de teste de E/S que normalmente usamos em demonstrações.

foto

Cálculo do limite de alarme e métodos de configuração

Depois de obter a linha de base de desempenho por meio do teste acima, os usuários podem calcular o limite de largura de banda de gravação e de leitura correspondentes e adicionar regras de alarme ao cluster. Tomemos a figura a seguir como exemplo para apresentar o método de cálculo do limite.

duas cópias

foto

Os dois conjuntos de dados acima foram testados em 1 host executando 1 máquina virtual em um cluster de 8 nós e 8 hosts executando 1 máquina virtual, respectivamente.

Nosso foco principal é a largura de banda. Tomando a largura de banda de gravação como exemplo, no cenário de gravação sequencial 8P8V 256K, a largura de banda de gravação é 7278. Dividimos 7278 por 8 para obter a largura de banda média de cada nó e depois convertemos MBPS em BPS. 70% desse valor é o limite de alarme que precisamos definir como nível de atenção.

Para o limite de alarme sério da largura de banda de gravação, observaremos o valor no cenário 8P1V 256K. A largura de banda de gravação aqui é de 1.656,86 MBPS. Após a conversão da unidade, 80% desse valor será usado diretamente como limite de alarme de gravidade . A partir disso, obtemos dois valores limite de largura de banda de gravação, conforme mostrado na figura abaixo.

foto

O método de cálculo do limite de alarme da largura de banda de leitura é o mesmo da largura de banda de gravação. No exemplo acima, a configuração do limite de largura de banda de leitura é mostrada na figura abaixo.

foto

Prática do usuário

Caso 1: Engenheiros de operação e manutenção recebem alarmes de desempenho em tempo hábil para evitar impacto nos negócios

Um usuário usou a ferramenta OWL para realizar um teste de estresse de largura de banda e descobriu que a largura de banda de um determinado nó no cluster excedeu 1,7 GB/s, o que excedeu o limite do nível de aviso crítico. O SmartX envia automaticamente alarmes em segundo plano para lembrar aos engenheiros de operação e manutenção que o desempenho do armazenamento está próximo do limite, evitando assim impacto direto nos negócios.

foto

Caso 2: Um banco estatal usa o modelo de E/S personalizado OWL para testar o desempenho do cluster

Para atender aos requisitos regulatórios, um banco estatal usou o OWL para testar o desempenho do cluster por 12 horas consecutivas de acordo com um modelo de E/S personalizado (48K, randrw=1:9). Os resultados do teste mostram (conforme mostrado na figura abaixo) que o desvio padrão médio do IOPS do cluster pode chegar a 54.338 e o atraso é de cerca de 1 milissegundo.

foto

Caso 3: Um banco estatal usa OWL para avaliar se o desempenho do cluster atende aos requisitos do 99º percentil

Um banco estatal prestou atenção ao requisito do 99º percentil e usou o OWL para testar o desempenho do armazenamento no tamanho do bloco correspondente para compreender intuitivamente o desempenho do cluster neste cenário. Os resultados do teste são mostrados na figura.

foto

Para saber mais sobre os recursos inteligentes de operação e manutenção hiperconvergentes do SmartX, leia: Um artigo para entender o mecanismo de detecção de integridade do disco rígido hiperconvergente SmartX e as práticas de operação e manutenção ou escaneie o código QR abaixo para obter o "SmartX hiper- princípios de tecnologia convergente e coleta de análise de recursos (incluindo detalhes de comparação do VMware)" e-book.

Acho que você gosta

Origin blog.csdn.net/weixin_43696211/article/details/132599142
Recomendado
Clasificación