¿Cómo utilizar la herramienta de prueba de rendimiento de almacenamiento SmartX OWL para optimizar la gestión del rendimiento?

Autor: Zhang Ruisong del equipo financiero SmartX, que está profundamente involucrado en la industria.

Cuando el personal de operación y mantenimiento gestiona los clústeres a diario, a veces inevitablemente se encuentran con las siguientes confusiones:

  • Una nueva empresa está lista para conectarse. ¿Cómo elegir el entorno de almacenamiento para alojar la empresa cuando hay varios conjuntos de almacenamiento disponibles?

  • La máquina virtual empresarial se ejecuta muy rápido cuando se inicia por primera vez, sin embargo, después de funcionar durante un período de tiempo, ¿por qué el software y el hardware siguen funcionando con lentitud aunque no haya problemas obvios?

  • Los comentarios de las empresas indican que el rendimiento de las máquinas virtuales a veces es bueno o malo.

  • El almacenamiento recién lanzado es diferente de la configuración original. ¿Cómo juzgar la diferencia de rendimiento entre los dos y para qué tipo de negocio son adecuados?

Todos estos escenarios implican el monitoreo del rendimiento del almacenamiento y también prueban la capacidad del personal de operación y mantenimiento para utilizar datos de monitoreo para organizar razonablemente la ubicación comercial y optimizar el rendimiento.

Para ayudar a los usuarios a gestionar mejor el rendimiento del almacenamiento en clúster, SmartX desarrolló de forma independiente la herramienta de prueba automatizada del rendimiento del almacenamiento OWL. En este artículo, presentaremos las características funcionales y el uso de OWL, y mostraremos cómo utilizar los resultados de las pruebas de OWL para optimizar la gestión del rendimiento y evitar cuellos de botella en el rendimiento a través de aplicaciones prácticas.

Introducción a las herramientas OWL

OWL es una plataforma web de prueba de rendimiento de almacenamiento automatizada desarrollada por SmartX que utiliza fio como herramienta de adquisición de rendimiento para realizar pruebas de estrés del rendimiento del clúster. Debido a que fio se puede ajustar a escenarios de prueba de modelos de múltiples colas, múltiples anchos de banda y múltiples E/S, puede simular la mayoría de las E/S empresariales (por ejemplo, fio se usa a menudo para pruebas de rendimiento y ajuste de MySQL), por lo que se ha convertido en el software más popular compatible con OWL. La mejor opción. Además, OWL no está vinculado a clústeres hiperconvergentes SmartX y los usuarios también pueden utilizar OWL en otros entornos para realizar pruebas de rendimiento .

OWL puede ayudar a los usuarios en las siguientes tres áreas:

Adáptese a diferentes configuraciones de hardware y proporcione a cada conjunto de almacenamiento su propia "línea base" de rendimiento de almacenamiento.

Para satisfacer las necesidades de transformación de la infraestructura de TI de Xinchuang, los usuarios pueden comprar accesorios domésticos con los que nunca antes habían tenido contacto. Con una combinación de varios accesorios, los ingenieros deben comprender cuánto rendimiento pueden lograr estas nuevas configuraciones de almacenamiento y qué aplicaciones y bases de datos admiten. El método de verificación tradicional consiste en utilizar directamente la nueva arquitectura para probar la ejecución de una máquina virtual empresarial, pero el uso de OWL puede simular un modelo de E/S similar para verificar el rendimiento del clúster, probando así la línea base de rendimiento de este almacenamiento en clúster.

Consulte la línea base de rendimiento del almacenamiento y el servicio de lanzamiento de máquinas virtuales por categoría.

Los usuarios pueden seleccionar clústeres de almacenamiento apropiados para las máquinas virtuales empresariales que deben estar en línea según la línea base de rendimiento de almacenamiento proporcionada por OWL . Por ejemplo, para servicios de bases de datos con grandes IOPS, los usuarios pueden usar clústeres totalmente flash. Para empresas con IOPS relativamente livianos y menos interacción de datos, los usuarios pueden usar clústeres híbridos flash con un rendimiento de mayor costo.

Además, además de permitir a los usuarios conocer de antemano la E/S máxima que cada host puede transportar, OWL también puede crear un entorno de simulación para ayudar a los usuarios a comprender el tamaño de E/S que pueden necesitar antes de que el negocio entre en línea, y razonablemente. asigne la ubicación de la máquina virtual para evitar Colocar varias máquinas virtuales que ocupan un gran ancho de banda en un host hará que el ancho de banda sea "perseguido por la empresa" después del lanzamiento oficial de la empresa.

Combinado con la función de alarma, advierte de forma proactiva sobre riesgos de cuellos de botella en el rendimiento.

Después de usar OWL para obtener la línea base de la prueba de rendimiento, los usuarios pueden configurar el umbral de ancho de banda de lectura y escritura correspondiente al rendimiento del almacenamiento en las reglas de alarma de cada clúster. Cuando el ancho de banda de la máquina virtual alcanza el 70% y el 80% del ancho de banda principal, el ingeniero de operación y mantenimiento recibirá avisos de alarma respectivamente, para observar el uso del ancho de banda de la máquina virtual y otros hosts de manera oportuna. De esta manera, los usuarios pueden migrar esta máquina virtual a un host o clúster relativamente inactivo antes de que se lance el nuevo negocio.

Método de uso de OWL y proceso de prueba.

Preparación antes de la prueba

Dado que la herramienta OWL funciona como una máquina virtual, el usuario debe importar ovf, configurar la dirección IP para OWL y garantizar la comunicación ssh entre OWL y la VM de prueba. Los requisitos de configuración de la máquina virtual de prueba son los siguientes:

  • Linux 2c 4G 40G+50G

  • Configure la dirección IP y comuníquese con la herramienta OWL ssh

  • Instalar el software FIO

Proceso de prueba

  1. Inicie sesión en la interfaz web de OWL.

  2. Crea un modelo de prueba.

  3. Agregue objetos de prueba.

  4. Crea tareas de prueba.

  5. Inicie la tarea de prueba.

  6. OWL combina la función de alarma para advertir de forma proactiva sobre riesgos de cuellos de botella en el rendimiento.

Para conocer el proceso de prueba detallado, consulte la siguiente demostración: Introducción a las herramientas de prueba automatizadas, administración y monitoreo del rendimiento del almacenamiento en clúster .

Utilice los resultados de las pruebas para optimizar la gestión del rendimiento del almacenamiento

Modelos de prueba comunes

El siguiente es el modelo de prueba de E/S que utilizamos comúnmente en las demostraciones.

imagen

Métodos de cálculo y configuración del umbral de alarma.

Después de obtener la línea base de rendimiento a través de la prueba anterior, los usuarios pueden calcular el umbral de ancho de banda de escritura y el umbral de ancho de banda de lectura correspondientes, y agregar reglas de alarma al clúster. Tomemos la siguiente figura como ejemplo para presentar el método de cálculo del umbral.

dos copias

imagen

Los dos conjuntos de datos anteriores se probaron en 1 host que ejecuta 1 máquina virtual en un clúster de 8 nodos y en 8 hosts que ejecutan 1 máquina virtual, respectivamente.

Nuestro principal objetivo es el ancho de banda. Tomando el ancho de banda de escritura como ejemplo, en el escenario de escritura secuencial 8P8V 256K, el ancho de banda de escritura es 7278. Dividimos 7278 entre 8 para obtener el ancho de banda promedio de cada nodo y luego convertimos MBPS a BPS. El 70% de este valor es el umbral de alarma que debemos establecer como nivel de atención.

Para el umbral de alarma grave del ancho de banda de escritura, veremos el valor en el escenario 8P1V 256K. El ancho de banda de escritura aquí es 1656,86 MBPS. Después de la conversión de unidades, el 80% de este valor se utilizará directamente como umbral de alarma de gravedad . A partir de esto, obtenemos dos valores de umbral de ancho de banda de escritura, como se muestra en la siguiente figura.

imagen

El método de cálculo del umbral de alarma del ancho de banda de lectura es el mismo que el del ancho de banda de escritura. En el ejemplo anterior, la configuración del umbral del ancho de banda de lectura es como se muestra en la siguiente figura.

imagen

Práctica de usuario

Caso 1: Los ingenieros de operación y mantenimiento reciben alarmas de rendimiento de manera oportuna para evitar el impacto en el negocio

Un usuario utilizó la herramienta OWL para realizar una prueba de estrés del ancho de banda y descubrió que el ancho de banda de un determinado nodo en el clúster excedía los 1,7 GB/s, lo que excedía el umbral del nivel de advertencia crítico. SmartX envía automáticamente alarmas en segundo plano para recordar a los ingenieros de operación y mantenimiento que el rendimiento del almacenamiento está cerca del límite, evitando así un impacto directo en el negocio.

imagen

Caso 2: un banco estatal utiliza el modelo de E/S personalizado de OWL para probar el rendimiento del clúster

Para cumplir con los requisitos reglamentarios, un banco estatal utilizó OWL para probar el rendimiento del clúster durante 12 horas consecutivas según un modelo de E/S personalizado (48K, randrw=1:9). Los resultados de la prueba muestran (como se muestra en la figura siguiente) que la desviación estándar promedio de IOPS del clúster puede alcanzar 54338 y el retraso es de aproximadamente 1 milisegundo.

imagen

Caso 3: Un banco estatal utiliza OWL para evaluar si el rendimiento del clúster cumple con los requisitos del percentil 99

Un banco estatal prestó atención al requisito del percentil 99 y utilizó OWL para probar el rendimiento del almacenamiento en el tamaño de bloque correspondiente para comprender intuitivamente el rendimiento del clúster en este escenario. Los resultados de la prueba se muestran en la figura.

imagen

Para obtener más información sobre las funciones de operación y mantenimiento inteligentes hiperconvergentes de SmartX, lea: Un artículo para comprender el mecanismo de detección del estado del disco duro hiperconvergente SmartX y las prácticas de operación y mantenimiento , o escanee el código QR a continuación para obtener el "SmartX hiperconvergente". Principios de tecnología convergente y recopilación de análisis de características (incluidos los detalles de comparación de VMware)".

Supongo que te gusta

Origin blog.csdn.net/weixin_43696211/article/details/132599142
Recomendado
Clasificación